跳转到内容

10.6.1 项目路线图:构建视觉证据包

计算机视觉项目不是“我用了一个模型”,而是数据、标注、模型输出、指标、失败案例和展示的闭环。

视觉任务输出粒度递进图

视觉项目交付闭环图

计算机视觉证据包图

如果需要最快跑通完整闭环,从分类开始;需要框就进入检测,需要 mask 就进入分割,OCR/视频/3D 适合专门场景。

在称为可展示项目前,先跑这个检查。

project = {
"task": "helmet detection",
"has_data_note": True,
"has_metric": True,
"has_failure_case": True,
"has_annotation_rule": True,
}
ready = all(project[key] for key in ["has_data_note", "has_metric", "has_failure_case", "has_annotation_rule"])
print("task:", project["task"])
print("presentable:", ready)

预期输出:

Terminal window
task: helmet detection
presentable: True

如果项目没有标注规则或失败案例,它仍然只是演示,不是作品集项目。

步骤项目类型证据
1分类数据划分、accuracy/F1、混淆样例
2检测框标注、IoU/mAP、误报和漏检
3分割masks、IoU/Dice、边界失败
4行业场景风险说明、用户影响、部署想法
5实操工作坊在大项目页前先跑可复现迷你流水线

扩展项目前,先运行 10.6.4 实操:构建可复现视觉迷你流水线

交付物最低要求更强的作品集版本
README目标、运行命令、依赖、示例增加任务边界、数据来源、部署想法
数据与标注图像来源、类别列表、标注格式增加标注示例、质量检查、偏差说明
结果至少 1 张输入图和预测结果增加正确、误报、漏检、边界案例
评估Accuracy、F1、mAP、IoU、Dice 或 OCR 命中率按类别、场景、光照、清晰度做错误分析
失败分析至少 1 个真实失败增加疑似原因、修复动作、回归检查
展示截图或短 GIF 证明能运行构建清晰的视觉项目页面

如果你的视觉项目可复现,有清晰数据和标注规则,报告合适指标,并展示模型在哪里失败,就通过了本章。

检查思路与讲解
  1. 合格答案要把任务映射到正确的视觉输出:类别标签、检测框、mask、OCR 文本、embedding 或视频事件。
  2. 证据应包含渲染后的视觉产物,以及一个指标或定性错误说明。
  3. 自检时要能指出一个视觉失败模式,例如类别混淆、漏检、mask 边界差、光照变化、领域偏移或标注质量弱。

学完这一页,至少保留这张证据卡:

任务输出
分类标签、检测框、分割掩膜、OCR 文本或视频事件
工件
原始图像、处理后图像、预测叠加图、指标文件和失败样本
指标
准确率/F1、mAP、IoU、Dice、延迟或场景特定审查分数
失败检查
数据质量、标签错误、预处理不匹配、阈值或部署约束
期望产出
一个可复现的运行文件夹,包含可视化输出和简短失败报告