跳转到内容

10.0 学习检查表:计算机视觉

这页当成可打印检查表使用。需要完整讲解时,回到 第 10 章入口页

视觉作品集证据包

时间做什么能说出这句话就停
20 分钟看输出粒度阶梯图“分类、检测、分割的区别在输出。”
25 分钟运行像素小实验“我能检查尺寸、通道、RGB 和灰度。”
25 分钟浏览 10.1 图像基础“预处理会改变模型看到的数据。”
25 分钟浏览分类、检测、分割路线图“我知道哪个指标对应哪个任务。”
25 分钟阅读调试闭环“怀疑架构前,应先检查数据和标签。”
证据最小版本
opencv_demo.pypixel_lab.py读取或生成图像、预处理、保存输出
vision_dataset.md数据来源、类别、样本数、标注方式、限制
eval_results.mdaccuracy/F1、mAP、IoU/Dice、OCR 命中率或自选指标
failure_cases.md失败图片、可能原因、修复方向
README.md任务目标、运行命令、输入输出示例、场景边界
闸门通过条件
视觉链路原图、处理图、预测图和失败图用可对应的文件名保存。
标注数据集说明写清类别、框或 mask、来源、划分和已知标注不确定性。
指标匹配accuracy/F1、mAP、IoU/Dice 或 OCR 命中率与任务输出匹配。
真实边界报告写明光照、角度、相机或来源、延迟、图像尺寸和设备限制。
  • 你能按输出形态解释分类、检测、分割和 OCR 吗?
  • 你能展示原图、处理图和预测可视化吗?
  • 你能解释标注质量为什么影响指标吗?
  • 你能为正确任务选择 accuracy/F1、mAP、IoU 或 Dice 吗?
  • 你能说明为什么演示到真实图片上会失效吗?

如果答案都是可以,就可以把视觉能力接到第 12 章的多模态方向。

学完这一页,至少保留这张证据卡:

任务输出
分类标签、检测框、分割掩膜、OCR 文本或视频事件
工件
原始图像、处理后图像、预测叠加图、指标文件和失败样本
指标
准确率/F1、mAP、IoU、Dice、延迟或场景特定审查分数
失败检查
数据质量、标签错误、预处理不匹配、阈值或部署约束
期望产出
一个可复现的运行文件夹,包含可视化输出和简短失败报告