メインコンテンツへスキップ

9.0 学習チェックリスト:AI Agent とエージェントシステム

このページは印刷用チェックリストとして使います。詳しい説明が必要なときは、第 9 章入口ページ に戻ってください。

Agent trace 証拠パック

2時間の初回通読

時間やることここまで言えたら止める
20 分入口ページの実行ループを見る「Agent は goal-state-tool-observation ループである。」
25 分trace スクリプトを動かす「すべての action と observation を再生できる。」
25 分9.1 と 9.2 をざっと読む「Agent、workflow、RAG、ReAct、Plan-and-Execute を分けられる。」
25 分9.3 のツール安全をざっと読む「tool schema と権限は、巧妙な Prompt より重要。」
25 分境界選択図を読む「Agent を使わない方がよい場面が分かる。」

必ず残す証拠

証拠最小版
tools_schema.md1~2個のツール。name、purpose、parameters、return value、errors、risk level を記載
agent_traces.jsonl少なくとも3回の実行。goal、step、action、input、observation、result を記録
safety_boundary.md最大ステップ、ツールホワイトリスト、ブロック action、人間承認ルール
failure_cases.md少なくとも3つの失敗。誤ツール、悪い引数、ループ、権限ブロック、未対応回答
eval_tasks.csv3~5個の固定タスク。期待結果と成功基準を含む
README.md実行コマンド、trace 例、安全例、評価結果、制限

品質ゲート

ゲート合格条件
Tool schema各ツールに purpose、parameters、return value、errors、risk level がある。
Trace replayレビュー担当者が、すべてのツール呼び出しの理由を再現できる。
Safety boundaryホワイトリスト外または危険な action がブロックされるか、人間承認へ回る。
Stop control最大ステップと停止条件が、ループとコスト急増を防ぐ。

章を出る前の質問

  • Agent と普通の LLM アプリの違いを説明できますか?
  • trace を示し、各ツール呼び出しがなぜ起きたか説明できますか?
  • 高リスクまたはホワイトリスト外のツールをブロックできますか?
  • 停止条件と最大ステップ数を定義できますか?
  • 多 Agent は単一 Agent の信頼性のあとに進むべき理由を説明できますか?

答えがすべて「はい」なら、次の方向へ進みます。配置、マルチモーダル Agent、またはコース最終プロジェクトです。