跳转到内容

10.4.1 图像分割路线图:像素级区域

分割比检测更细。它不是输出框,而是输出 mask,说明哪些像素属于某个类别或实例。

图像分割章节学习顺序图

语义分割 mask 示例

语义分割 IoU 与边界图

本章最重要的对象是 mask。常见失败通常是边界质量、小目标、遮挡或类别混淆。

这个脚本比较两个极小二值 mask。

truth = [
[1, 1, 0],
[1, 0, 0],
[0, 0, 0],
]
pred = [
[1, 0, 0],
[1, 1, 0],
[0, 0, 0],
]
intersection = 0
union = 0
for y in range(3):
for x in range(3):
intersection += truth[y][x] == 1 and pred[y][x] == 1
union += truth[y][x] == 1 or pred[y][x] == 1
print("mask_iou:", round(intersection / union, 3))

预期输出:

Terminal window
mask_iou: 0.5

分割报告要展示 mask、指标和边界错误,而不只是彩色叠加图。

步骤阅读实操产出
1语义分割为每个像素预测一个类别
2实例分割分开同类别的不同对象
3分割实战比较 mask、IoU/Dice、边界错误和失败样例

如果你能创建或检查一个 mask,计算简单重叠指标,并解释一个边界或类别混淆失败,就通过了本章。

检查思路与讲解
  1. 合格答案要把任务映射到正确的视觉输出:类别标签、检测框、mask、OCR 文本、embedding 或视频事件。
  2. 证据应包含渲染后的视觉产物,以及一个指标或定性错误说明。
  3. 自检时要能指出一个视觉失败模式,例如类别混淆、漏检、mask 边界差、光照变化、领域偏移或标注质量弱。

学完这一页,至少保留这张证据卡:

输入图像
原始图像和目标掩膜或类别图
预测
预测掩膜、叠加可视化和边界示例
指标
IoU、Dice、每类得分和边界失败备注
失败检查
标注质量、边界过窄、小区域或类别混淆
期望产出
掩膜叠加图,以及分割指标汇总