6.0 学习指南与任务单：深度学习与 Transformer 基础

深度学习学习指南训练闭环

主要学习路线已经放在第 6 章入口。本页只作为练习时快速查看的清单。

一句话模型

batch 数据模型前向损失反向传播梯度优化器更新曲线

如果代码看起来很长，先找出这六步。

第 6 章结束时，你应该留下一个小证据文件夹，而不只是读完笔记：

deep_learning_evidence/
  shape_trace.txt
  training_log.csv
  loss_curve.png
  best_checkpoint_note.md
  attention_note.md
  failure_sample_note.md

如果这个文件夹还没有出现，即使页面都读完了，第 6 章也还没有真正完成。

检查项	证据
能解释 forward、loss、backward、optimizer	训练闭环说明
能运行一个最小 PyTorch 脚本	`train.py`
能打印模型中的 tensor shape	shape trace
能对比训练曲线和验证曲线	曲线图片或 CSV
能解释 Attention 改变了什么	attention 说明
能完成证据包工作坊	`deep_learning_workshop_run/`

检查思路与讲解

这张清单的目标不是让你背概念，而是确认你能留下可检查的学习证据：

产物	应该回答什么
训练闭环说明	forward、loss、backward、optimizer step 分别发生了什么？
shape trace	tensor shape 在模型里怎样变化？
曲线图片或 CSV	模型是在欠拟合、过拟合，还是稳定变好？
attention 说明	Attention 增加了什么信息，还有什么依然困难？
失败样本记录	哪个样本失败了，这说明数据、模型还是标签哪里有问题？

第 6 章的小实验大多是“显微镜”，不是完整产品验证。做完后用三句话收尾：

这个实验证明了：
这个实验没有证明：
如果要用于真实项目，还要补：

常见写法：

离开第 6 章前，保留一个紧凑证据包：

当你能训练一个小模型、保存训练日志、查看失败样本，并解释模型为什么变好或失败时，就可以进入第 7 章。