10.0 学习检查表:计算机视觉
这页当成可打印检查表使用。需要完整讲解时,回到 第 10 章入口页。

两小时快速通读
Section titled “两小时快速通读”| 时间 | 做什么 | 能说出这句话就停 |
|---|---|---|
| 20 分钟 | 看输出粒度阶梯图 | “分类、检测、分割的区别在输出。” |
| 25 分钟 | 运行像素小实验 | “我能检查尺寸、通道、RGB 和灰度。” |
| 25 分钟 | 浏览 10.1 图像基础 | “预处理会改变模型看到的数据。” |
| 25 分钟 | 浏览分类、检测、分割路线图 | “我知道哪个指标对应哪个任务。” |
| 25 分钟 | 阅读调试闭环 | “怀疑架构前,应先检查数据和标签。” |
必须留下的证据
Section titled “必须留下的证据”| 证据 | 最小版本 |
|---|---|
opencv_demo.py 或 pixel_lab.py | 读取或生成图像、预处理、保存输出 |
vision_dataset.md | 数据来源、类别、样本数、标注方式、限制 |
eval_results.md | accuracy/F1、mAP、IoU/Dice、OCR 命中率或自选指标 |
failure_cases.md | 失败图片、可能原因、修复方向 |
README.md | 任务目标、运行命令、输入输出示例、场景边界 |
| 闸门 | 通过条件 |
|---|---|
| 视觉链路 | 原图、处理图、预测图和失败图用可对应的文件名保存。 |
| 标注 | 数据集说明写清类别、框或 mask、来源、划分和已知标注不确定性。 |
| 指标匹配 | accuracy/F1、mAP、IoU/Dice 或 OCR 命中率与任务输出匹配。 |
| 真实边界 | 报告写明光照、角度、相机或来源、延迟、图像尺寸和设备限制。 |
- 你能按输出形态解释分类、检测、分割和 OCR 吗?
- 你能展示原图、处理图和预测可视化吗?
- 你能解释标注质量为什么影响指标吗?
- 你能为正确任务选择 accuracy/F1、mAP、IoU 或 Dice 吗?
- 你能说明为什么演示到真实图片上会失效吗?
如果答案都是可以,就可以把视觉能力接到第 12 章的多模态方向。
学完这一页,至少保留这张证据卡:
- 任务输出
- 分类标签、检测框、分割掩膜、OCR 文本或视频事件
- 工件
- 原始图像、处理后图像、预测叠加图、指标文件和失败样本
- 指标
- 准确率/F1、mAP、IoU、Dice、延迟或场景特定审查分数
- 失败检查
- 数据质量、标签错误、预处理不匹配、阈值或部署约束
- 期望产出
- 一个可复现的运行文件夹,包含可视化输出和简短失败报告