コンテンツにスキップ

9.0 学習チェックリスト:AI Agent とエージェントシステム

このページは印刷用チェックリストとして使います。詳しい説明が必要なときは、第 9 章入口ページ に戻ってください。

Agent トレース 証拠パック

時間やることここまで言えたら止める
20 分入口ページの実行ループを見る「Agent は goal-state-tool-observation ループである。」
25 分トレース スクリプトを動かす「すべての action と observation を再生できる。」
25 分9.1 と 9.2 をざっと読む「Agent、ワークフロー、RAG、ReAct、Plan-and-Execute を分けられる。」
25 分9.3 のツール安全をざっと読む「ツールスキーマ と権限は、巧妙な Prompt より重要。」
25 分境界選択図を読む「Agent を使わない方がよい場面が分かる。」
証拠最小版
tools_schema.md1~2個のツール。名前、目的、パラメータ、戻り値、エラー、リスクレベルを記載
agent_traces.jsonl少なくとも3回の実行。目標、ステップ、行動、入力、観察、結果を記録
safety_boundary.md最大ステップ、ツールホワイトリスト、ブロック action、人間承認ルール
protocol_card.mdMCP/server capability、peer-agent handoff fields、authorization rule、trace fields
agent_sandbox_trace.jsonallow/confirm/deny decisions と blocked injection または tool-poisoning の例
failure_cases.md少なくとも3つの失敗。誤ツール、悪い引数、ループ、権限ブロック、未対応回答
eval_tasks.csv3~5個の固定タスク。期待結果と成功基準を含む
README.md実行コマンド、トレース 例、安全例、評価結果、制限
ゲート合格条件
ツールスキーマ各ツールに目的、パラメータ、戻り値、エラー、リスクレベルがある。
トレース再生レビュー担当者が、すべてのツール呼び出しの理由を再現できる。
安全境界ホワイトリスト外または危険な action がブロックされるか、人間承認へ回る。
停止制御最大ステップと停止条件が、ループとコスト急増を防ぐ。

期待される結果:第 9 章のプロジェクトフォルダに、ツールスキーマ、再生可能なトレース、安全境界、固定評価タスク、失敗メモ、ループが信頼できるまで単一 Agent に留める理由を書いた README がそろっている状態です。

  • Agent と普通の LLM アプリの違いを説明できますか?
  • トレース を示し、各ツール呼び出しがなぜ起きたか説明できますか?
  • 高リスクまたはホワイトリスト外のツールをブロックできますか?
  • Tool discovery、authorization、agent handoff を分けて説明できますか?
  • 停止条件と最大ステップ数を定義できますか?
  • 多 Agent は単一 Agent の信頼性のあとに進むべき理由を説明できますか?
確認の考え方と解説
  1. Agent は goal-plan-tool-observation の閉ループを保つので、単に1回答えるだけでなく、実行して結果を観察し、次の手を決められます。
  2. 良い trace には goal、plan step、tool call、input、observation、そして次の step がなぜその observation から出たのかが含まれます。
  3. tool allowlist、schema チェック、risk label、最大ステップ数、必要時の人間承認で、高リスクまたはホワイトリスト外のツールを止められます。
  4. 良い停止条件は、成功、進展なし、最大ステップ到達、risk escalation です。
  5. まず single Agent を安定させるべきなのは、multi Agent のほうが追跡、デバッグ、安全制御が難しいからです。

答えがすべて「はい」なら、次の方向へ進みます。配置、マルチモーダル Agent、またはコース最終プロジェクトです。

このページを終えたら、この証拠カードを残します。

単一エージェントtrace
完全な目標-計画-行動-観測ループを1回分
ツール契約
スキーマ、権限、エラー時の挙動、観察
メモリ記録
何が書かれ、検索され、忘れられ、更新されるか
評価メモ
成功スコア、安全性確認、失敗理由
プロジェクトREADME
実行コマンド、trace、制約、次の行動