コンテンツにスキップ

6.0 学習ガイドとタスクリスト:深層学習と Transformer 基礎

深層学習学習ガイドのトレーニングループ

主な学習ルートは 第 6 章の入口 にまとめました。このページは、練習中に見る短いチェックリストとして使います。

batch データモデル forwardloss勾配 backwardoptimizer step曲線

コードが長く見えるときは、まずこの 6 ステップを探します。

第6章の終わりには、読書メモだけでなく、小さな証拠フォルダが残っている状態にします。

deep_learning_evidence/
shape_trace.txt
training_log.csv
loss_curve.png
best_checkpoint_note.md
attention_note.md
failure_sample_note.md

このフォルダがなければ、ページを読み終えていても、第6章はまだ完了ではありません。

チェック証拠
forward、loss、backward、optimizer を説明できる学習ループメモ
最小 PyTorch スクリプトを実行できるtrain.py
モデル内の tensor shape を表示できるshape trace
学習曲線と検証曲線を比較できる曲線画像または CSV
Attention が何を変えたか説明できるattention メモ
証拠パックワークショップを完了できるdeep_learning_workshop_run/
確認の考え方と解説

このチェックリストの目的は、概念を暗記することではなく、確認できる学習証拠を残すことです。

  1. 学習ループメモでは、forward、loss、backward、optimizer の 4 ステップと、それぞれが何を変えるかを説明します。
  2. 最小 PyTorch スクリプトは単独で実行でき、data、model、loss、optimizer、training loop を含んでいる必要があります。
  3. shape trace は入力、主要な中間層、出力を含め、batch、channel、sequence などの意味を説明できる形にします。
  4. 曲線画像または CSV は、過学習、過小適合、learning rate の不安定さ、data issue を診断するために使います。
  5. Attention メモでは、文脈に応じて情報を動的に選ぶ仕組みを説明します。式だけでは不十分です。
  6. 証拠パックには code、run log、plot、振り返りを含め、他の人が結論を再現できるようにします。
成果物答えるべきこと
学習ループメモforward、loss、backward、optimizer step で何が起きるか。
shape traceモデル内で tensor shape がどう変わるか。
曲線画像または CSVモデルは underfitting、overfitting、順調な改善のどれか。
attention メモAttention は何を増やし、何がまだ難しいか。
失敗サンプルメモどのサンプルが失敗し、それはデータ、モデル、ラベルのどれを示しているか。

第 6 章を終える前に、compact evidence pack を 1 つ残します。

形状trace
1つのモデルと出力されたテンソル形状
学習ログ
時間に対する train と validation loss
最良チェックポイント
最良モデルがどのように選ばれたか
attention メモ
Q/K/V、mask、next-token への橋渡し
失敗サンプル
誤った、または弱い予測1件と次の行動
プロジェクトフォルダ
実行可能な証拠パックまたは README

小さなモデルを学習し、ログを保存し、失敗サンプルを確認し、なぜ改善または失敗したかを説明できたら、第 7 章へ進めます。