コンテンツにスキップ

A.9 学習リソース早見表

AI プロジェクト早見表の全体図

AI プロジェクト早見表のトラブルシュート索引

プロジェクト中に調べるページです。上から順に読む必要はありません。

Terminal window
python --version
which python
pip --version
pip list
pwd
ls

ドキュメントサイト:

Terminal window
npm install
npm run start
npm run build

NVIDIA GPU:

Terminal window
nvidia-smi
タスク最初に試すもの
表形式の分類/回帰線形モデルまたは木モデル
テキスト分類TF-IDF + LogisticRegression
画像分類転移学習
固有表現抽出ルール/辞書 baseline、その後系列モデル
文書 Q&Aキーワード/BM25 検索、その後 RAG
Agent ツール利用単一 Agent + 安全なツール 1 つ
タスク最初に見る指標
クラスが均衡した分類Accuracy、F1
不均衡分類Precision、Recall、F1、混同行列
回帰MAE、RMSE、残差レビュー
検索 / RAGHit@K、MRR、引用正確性、人手レビュー
Agent成功率、ツールエラー、コスト、trace レビュー
サイン先に確認
loss が下がらないラベル、loss 関数、学習率、入力形式
train は良いが validation が悪い過学習、データ漏洩、分布ずれ
accuracy が変わらない特徴が弱い、ラベルが誤り、モデルが学習していない
GPU OOMbatch size、入力長、モデルサイズ
結果が不安定random seed、データ不足、分割の不一致
  1. 文書は正しく分割されているか。
  2. 検索は正しい chunk を返すか。
  3. 回答に出典が含まれるか。
  4. 回答は本当に検索内容を使っているか。
  5. 権限フィルタと「答えられない」動作があるか。
  1. 単発 Q&A から始める。
  2. ツールを 1 つ追加する。
  3. 厳密なパラメータ schema を追加する。
  4. ログと trace 再生を追加する。
  5. 権限境界と停止条件を追加する。
あなたは ____ です。
あなたのタスクは ____ です。
入力:
出力形式:
制約:
情報が不足している場合は明確にそう言ってください。
data = [(1.0, 2.0), (2.0, 4.0), (3.0, 6.0)]
w = 0.0
lr = 0.01
for epoch in range(3):
total_loss = 0.0
for x, y in data:
pred = w * x
error = pred - y
total_loss += error * error
grad = 2 * error * x
w -= lr * grad
print(f"epoch={epoch} w={w:.3f} loss={total_loss:.3f}")

期待される出力:

Terminal window
epoch=0 w=0.521 loss=48.630
epoch=1 w=0.907 loss=26.580
epoch=2 w=1.192 loss=14.528

データ -> 予測 -> 損失 -> 勾配 -> パラメータ更新、の順に読みます。

このページを終えたら、この証拠カードを残します。

学習ギャップ
強化すべき概念、コードスキル、プロジェクトスキル、論文、またはデプロイスキル
資源選択
1つの主要なリソースと、それが現在のボトルネックに合う理由
時間枠
プロジェクトに戻る前にどれだけ使うか
リスク確認
証拠を作らずにリソースを集めること
期待される成果
読書後に作成する 1つのアーティファクトがある短いリソース計画