10.3.1 目标检测路线图：类别加框

目标检测在分类上增加位置：图里有什么对象，它在哪里？

先看框工作流

目标检测章节学习流程图

目标检测输出图

检测输出 IoU 错误图

重要概念是 bounding box、class、confidence、IoU、threshold、false positive、false negative 和 mAP。

跑一个 IoU 检查

IoU 衡量预测框和真实框重叠多少。

truth = (10, 10, 50, 50)
pred = (20, 20, 60, 60)

def area(box):
    x1, y1, x2, y2 = box
    return max(0, x2 - x1) * max(0, y2 - y1)

ix1 = max(truth[0], pred[0])
iy1 = max(truth[1], pred[1])
ix2 = min(truth[2], pred[2])
iy2 = min(truth[3], pred[3])
intersection = area((ix1, iy1, ix2, iy2))
union = area(truth) + area(pred) - intersection

print("iou:", round(intersection / union, 3))

预期输出：

iou: 0.391

检测调试从打印框和指标开始。不要凭一张漂亮截图判断检测质量。

按这个顺序学

步骤	阅读	实操产出
1	检测概览	解释 box、class、confidence、IoU、mAP
2	经典检测器	比较 two-stage 和 one-stage 思路
3	YOLO	理解网格预测、阈值、NMS 和速度取舍
4	检测实战	记录误报、漏检和阈值变化

通过标准

如果你能用框、confidence、IoU 和至少一个误报或漏检案例解释检测结果，就通过了本章。

检查思路与讲解

合格答案要把任务映射到正确的视觉输出：类别标签、检测框、mask、OCR 文本、embedding 或视频事件。
证据应包含渲染后的视觉产物，以及一个指标或定性错误说明。
自检时要能指出一个视觉失败模式，例如类别混淆、漏检、mask 边界差、光照变化、领域偏移或标注质量弱。

留下的证据

学完这一页，至少保留这张证据卡：

输入图像: 带有真实或期望目标的检测样本
预测: 框、标签、置信分数、IoU 和阈值设置
指标: 精确率/召回率、mAP、误报和漏报
失败检查: 小目标、重叠、NMS、标签差或置信度阈值问题
期望产出: 带标注的图片，以及检测指标或错误分组