5分钟部署YOLO11，实例分割快速上手实战-程序员充电站

5分钟部署YOLO11，实例分割快速上手实战

1. 快速部署与环境准备

你是不是也经常被复杂的深度学习环境配置搞得头大？尤其是做计算机视觉项目时，光是装依赖、配CUDA就能耗掉半天。今天这篇文章就是来帮你“省时间”的——我们用一个预置好的YOLO11 镜像，5分钟内完成全部部署，直接进入模型训练和推理环节。

这个镜像名叫YOLO11，它已经集成了 Ultralytics 最新版本的 YOLO11 完整运行环境，包括 PyTorch、CUDA、OpenCV 等所有必要组件，开箱即用，无需手动安装任何包。特别适合想快速验证想法、做原型开发或者教学演示的朋友。

1.1 如何使用该镜像？

镜像提供了两种常用访问方式：Jupyter Notebook 和 SSH。

Jupyter Notebook：适合新手交互式操作，可以直接在浏览器中写代码、看结果。
SSH：适合有经验的开发者进行远程调试或批量处理任务。

启动后你会看到熟悉的文件结构，进入项目主目录即可开始操作：

cd ultralytics-8.3.9/

整个过程不需要你从零搭建环境，省去了大量踩坑时间。

2. 实例分割全流程实战

接下来我们一步步带你走完从数据准备到模型训练再到推理展示的完整流程。重点是：每一步都简单明了，小白也能跟着做出来。

2.1 数据标注：用 Labelme 打标签

我们要做的任务是实例分割（Instance Segmentation），也就是不仅要框出物体位置，还要精确标出它的轮廓。

推荐使用工具：Labelme
官网地址：https://github.com/wkentaro/labelme

操作步骤很简单：

启动 Labelme，点击 “打开目录” 加载你的图片；
选择 “创建多边形”，沿着物体边缘一点一点画；
标完后点击 “Save”，会生成一个同名的.json文件。

每个 JSON 文件里记录了图像中所有对象的类别和顶点坐标，这是原始标注数据。

小贴士：如果你要标注人、车、猫狗等常见类别，建议提前统一命名规则，比如person,car,dog，避免后面出错。

2.2 转换格式：Labelme JSON → YOLO TXT

YOLO11 不认 JSON，它需要一种特定的文本格式来表示分割标签：

<class-id> <x1> <y1> <x2> <y2> ... <xn> <yn>

其中：

<class-id>是类别编号（如 0 表示人）
后面是一系列归一化后的多边形顶点坐标（范围 [0,1]）

所以我们得把 Labelme 输出的 JSON 转成这种格式。下面这段 Python 脚本就能自动完成转换：

import json import os # 类别映射表，按实际需求修改 label_to_class_id = { "person": 0, "car": 1, "bicycle": 2, } def convert_labelme_json_to_yolo(json_file, output_dir, img_width, img_height): with open(json_file, 'r') as f: data = json.load(f) file_name = os.path.splitext(os.path.basename(json_file))[0] txt_path = os.path.join(output_dir, f"{file_name}.txt") with open(txt_path, 'w') as txt_file: for shape in data['shapes']: label = shape['label'] points = shape['points'] class_id = label_to_class_id.get(label) if class_id is None: print(f"警告：未找到类别 '{label}'，跳过") continue normalized = [(x / img_width, y / img_height) for x, y in points] line = [str(class_id)] for x_norm, y_norm in normalized: line.append(f"{x_norm:.6f}") line.append(f"{y_norm:.6f}") txt_file.write(" ".join(line) + "\n") if __name__ == "__main__": json_dir = "json_labels" # 放json的文件夹 output_dir = "labels" # 输出txt的文件夹 img_width = 640 img_height = 640 if not os.path.exists(output_dir): os.makedirs(output_dir) for file in os.listdir(json_dir): if file.endswith(".json"): path = os.path.join(json_dir, file) convert_labelme_json_to_yolo(path, output_dir, img_width, img_height)

运行之后，你会在labels/目录下看到一堆.txt文件，和图片一一对应，这就是 YOLO 可以读取的标签了。

2.3 组织数据集结构

为了让模型顺利读取数据，我们需要按照固定结构组织文件夹：

datasets/ └── seg_point_offer_20240930/ ├── train/ │ ├── images/ # 训练图 │ └── labels/ # 对应标签 ├── val/ │ ├── images/ # 验证图 │ └── labels/ # 对应标签

建议训练集和验证集比例为 8:2 或 9:1，确保模型能有效评估性能。

2.4 编写数据集配置文件（yaml）

在ultralytics/cfg/datasets/下新建一个 YAML 文件，比如叫my-seg.yaml：

path: ./datasets/seg_point_offer_20240930 train: train/images val: val/images names: 0: person 1: car 2: bicycle

这个文件告诉模型：

数据放在哪？
训练集和验证集路径是什么？
每个数字代表什么类别？

记住：path要写对相对路径，否则训练时报错找不到数据。

2.5 准备模型配置文件

YOLO11 提供了多种规模的模型，比如yolo11n-seg,yolo11s-seg,yolo11m-seg等，越小越快，越大越准。

我们以yolo11m-seg.yaml为例，它位于：

ultralytics/cfg/models/11/yolo11-seg.yaml

里面定义了网络结构、层数、通道数等参数。一般情况下不用改，除非你要做定制化设计。

如果你想换模型大小，只需要在代码里指定对应的 yaml 文件就行。

2.6 编写训练脚本 train.py

现在我们可以写训练代码了。创建一个train.py文件，放在ultralytics-8.3.9/根目录下：

from ultralytics import YOLO # 加载模型结构并加载预训练权重 model = YOLO("yolo11m-seg.yaml").load("weights/yolo11m-seg.pt") # 设置训练参数 train_params = { 'data': 'my-seg.yaml', # 数据配置文件 'epochs': 30, # 训练轮数 'imgsz': 640, # 输入尺寸 'batch': 8, # 每批数量 'device': 0, # 使用 GPU 0（若无GPU可设为'cpu'） 'workers': 4, # 数据加载线程 'project': 'runs/segment', # 结果保存项目名 'name': 'my_train', # 运行名称 'exist_ok': True, # 允许覆盖已有目录 'optimizer': 'AdamW', # 优化器 'lr0': 0.001, # 初始学习率 'weight_decay': 0.0005, 'warmup_epochs': 3, 'box': 7.5, 'cls': 0.5, 'dfl': 1.5, 'mask_ratio': 4, 'overlap_mask': True, 'save_period': -1, 'val': True, 'plots': True, 'amp': True, } # 开始训练 results = model.train(**train_params)

说明几点：

load("weights/yolo11m-seg.pt")是加载官方提供的预训练权重，能显著提升收敛速度；
device=0表示使用第一块 GPU，如果没有显卡，请改为'cpu'；
所有超参数都在字典里设置，清晰可控。

2.7 启动训练

一切就绪，执行命令：

python train.py

你会看到类似这样的输出：

Epoch GPU_mem box_loss seg_loss cls_loss Instances Size 1/30 5.26G 1.621 3.875 4.195 8 640: 100%|██████████| 38/38 [00:06<00:00, 6.12it/s] Class Images Instances Box(P) R mAP50 all 300 440 0.999 0.886 0.934

训练过程中，日志和图表会自动保存到runs/segment/my_train/目录下，包括：

weights/best.pt：最佳模型权重
weights/last.pt：最后一轮模型
results.png：训练曲线图
confusion_matrix.png：分类混淆矩阵

3. 模型推理：看看效果如何

训练完成后，最激动人心的时刻来了——用模型去预测新图片！

3.1 编写推理脚本 infer.py

from ultralytics import YOLO # 加载训练好的模型 model = YOLO("runs/segment/my_train/weights/best.pt") # 推理设置 results = model.predict( source="datasets/seg_point_offer_20240930/val/images", # 图片路径 conf=0.45, # 置信度阈值 iou=0.6, imgsz=640, device=0, save=True, # 保存结果图 save_txt=True, # 保存检测框和掩码 show_labels=True, show_conf=True, line_width=2 )

运行后，系统会在runs/predict/下生成带分割掩码的结果图，你可以直观看到模型是否准确识别出了每一个物体，并且轮廓贴合得很好。