10.4.1 图像分割路线图:像素级区域
分割比检测更细。它不是输出框,而是输出 mask,说明哪些像素属于某个类别或实例。
先看 Mask 工作流
Section titled “先看 Mask 工作流”


本章最重要的对象是 mask。常见失败通常是边界质量、小目标、遮挡或类别混淆。
跑一个 Mask IoU 检查
Section titled “跑一个 Mask IoU 检查”这个脚本比较两个极小二值 mask。
truth = [ [1, 1, 0], [1, 0, 0], [0, 0, 0],]
pred = [ [1, 0, 0], [1, 1, 0], [0, 0, 0],]
intersection = 0union = 0for y in range(3): for x in range(3): intersection += truth[y][x] == 1 and pred[y][x] == 1 union += truth[y][x] == 1 or pred[y][x] == 1
print("mask_iou:", round(intersection / union, 3))预期输出:
mask_iou: 0.5分割报告要展示 mask、指标和边界错误,而不只是彩色叠加图。
按这个顺序学
Section titled “按这个顺序学”| 步骤 | 阅读 | 实操产出 |
|---|---|---|
| 1 | 语义分割 | 为每个像素预测一个类别 |
| 2 | 实例分割 | 分开同类别的不同对象 |
| 3 | 分割实战 | 比较 mask、IoU/Dice、边界错误和失败样例 |
如果你能创建或检查一个 mask,计算简单重叠指标,并解释一个边界或类别混淆失败,就通过了本章。
检查思路与讲解
- 合格答案要把任务映射到正确的视觉输出:类别标签、检测框、mask、OCR 文本、embedding 或视频事件。
- 证据应包含渲染后的视觉产物,以及一个指标或定性错误说明。
- 自检时要能指出一个视觉失败模式,例如类别混淆、漏检、mask 边界差、光照变化、领域偏移或标注质量弱。
学完这一页,至少保留这张证据卡:
- 输入图像
- 原始图像和目标掩膜或类别图
- 预测
- 预测掩膜、叠加可视化和边界示例
- 指标
- IoU、Dice、每类得分和边界失败备注
- 失败检查
- 标注质量、边界过窄、小区域或类别混淆
- 期望产出
- 掩膜叠加图,以及分割指标汇总