9.0 学習チェックリスト:AI Agent とエージェントシステム
このページは印刷用チェックリストとして使います。詳しい説明が必要なときは、第 9 章入口ページ に戻ってください。

2時間の初回通読
Section titled “2時間の初回通読”| 時間 | やること | ここまで言えたら止める |
|---|---|---|
| 20 分 | 入口ページの実行ループを見る | 「Agent は goal-state-tool-observation ループである。」 |
| 25 分 | トレース スクリプトを動かす | 「すべての action と observation を再生できる。」 |
| 25 分 | 9.1 と 9.2 をざっと読む | 「Agent、ワークフロー、RAG、ReAct、Plan-and-Execute を分けられる。」 |
| 25 分 | 9.3 のツール安全をざっと読む | 「ツールスキーマ と権限は、巧妙な Prompt より重要。」 |
| 25 分 | 境界選択図を読む | 「Agent を使わない方がよい場面が分かる。」 |
必ず残す証拠
Section titled “必ず残す証拠”| 証拠 | 最小版 |
|---|---|
tools_schema.md | 1~2個のツール。名前、目的、パラメータ、戻り値、エラー、リスクレベルを記載 |
agent_traces.jsonl | 少なくとも3回の実行。目標、ステップ、行動、入力、観察、結果を記録 |
safety_boundary.md | 最大ステップ、ツールホワイトリスト、ブロック action、人間承認ルール |
protocol_card.md | MCP/server capability、peer-agent handoff fields、authorization rule、trace fields |
agent_sandbox_trace.json | allow/confirm/deny decisions と blocked injection または tool-poisoning の例 |
failure_cases.md | 少なくとも3つの失敗。誤ツール、悪い引数、ループ、権限ブロック、未対応回答 |
eval_tasks.csv | 3~5個の固定タスク。期待結果と成功基準を含む |
README.md | 実行コマンド、トレース 例、安全例、評価結果、制限 |
| ゲート | 合格条件 |
|---|---|
| ツールスキーマ | 各ツールに目的、パラメータ、戻り値、エラー、リスクレベルがある。 |
| トレース再生 | レビュー担当者が、すべてのツール呼び出しの理由を再現できる。 |
| 安全境界 | ホワイトリスト外または危険な action がブロックされるか、人間承認へ回る。 |
| 停止制御 | 最大ステップと停止条件が、ループとコスト急増を防ぐ。 |
期待される結果:第 9 章のプロジェクトフォルダに、ツールスキーマ、再生可能なトレース、安全境界、固定評価タスク、失敗メモ、ループが信頼できるまで単一 Agent に留める理由を書いた README がそろっている状態です。
章を出る前の質問
Section titled “章を出る前の質問”- Agent と普通の LLM アプリの違いを説明できますか?
- トレース を示し、各ツール呼び出しがなぜ起きたか説明できますか?
- 高リスクまたはホワイトリスト外のツールをブロックできますか?
- Tool discovery、authorization、agent handoff を分けて説明できますか?
- 停止条件と最大ステップ数を定義できますか?
- 多 Agent は単一 Agent の信頼性のあとに進むべき理由を説明できますか?
確認の考え方と解説
- Agent は goal-plan-tool-observation の閉ループを保つので、単に1回答えるだけでなく、実行して結果を観察し、次の手を決められます。
- 良い trace には goal、plan step、tool call、input、observation、そして次の step がなぜその observation から出たのかが含まれます。
- tool allowlist、schema チェック、risk label、最大ステップ数、必要時の人間承認で、高リスクまたはホワイトリスト外のツールを止められます。
- 良い停止条件は、成功、進展なし、最大ステップ到達、risk escalation です。
- まず single Agent を安定させるべきなのは、multi Agent のほうが追跡、デバッグ、安全制御が難しいからです。
答えがすべて「はい」なら、次の方向へ進みます。配置、マルチモーダル Agent、またはコース最終プロジェクトです。
このページを終えたら、この証拠カードを残します。
- 単一エージェントtrace
- 完全な目標-計画-行動-観測ループを1回分
- ツール契約
- スキーマ、権限、エラー時の挙動、観察
- メモリ記録
- 何が書かれ、検索され、忘れられ、更新されるか
- 評価メモ
- 成功スコア、安全性確認、失敗理由
- プロジェクトREADME
- 実行コマンド、trace、制約、次の行動