Skip to main content

10.2.1 图像分类路线图:图像输入、标签输出

图像分类回答一个问题:给定一整张图,它最像哪个类别?

先看分类闭环

图像分类章节学习流程图

图像分类架构演化图

分类训练诊断图

分类是最简单的视觉输出,但它仍然依赖数据划分、增强、架构、loss、指标和错误样例。

跑一个预测检查

这个脚本模拟分类器最后一步:选择分数最高的标签。

labels = ["cat", "dog", "panda"]
scores = [0.12, 0.74, 0.14]

best_index = max(range(len(scores)), key=lambda index: scores[index])

print("prediction:", labels[best_index])
print("confidence:", scores[best_index])

预期输出:

prediction: dog
confidence: 0.74

真实项目里不要只展示 top class。保留 confidence、错误样例和混淆模式。

按这个顺序学

步骤阅读实操产出
1数据增强解释哪些变化保持类别,哪些变化会带来风险
2现代架构比较特征提取器、分类头和预训练 backbone
3训练技巧追踪划分、loss、accuracy、过拟合和错误样例

通过标准

如果你能运行一个最小分类器,展示训练/验证指标,并解释至少一张失败图片,就通过了本章。