コンテンツにスキップ

9.2.1 推論ロードマップ:計画、行動、確認

Agent の推論は長い回答ではありません。使える中間手順を作り、次に何をするか決め、計画がまだ有効か確認する力です。

Agent 推論と計画の学習順序図

計画、実行、監視、再計画の図

推論状態チェックポイント図

基本習慣は、1 ステップを計画し、実行し、結果を観察し、状態チェックポイントを残し、状況が変われば再計画することです。

ツールを追加する前に、明示的な手順を作ります。出力できない計画は確認しにくいです。

task = "prepare a cited RAG demo answer"
plan = ["inspect question", "retrieve sources", "draft answer", "check citations"]
print("task:", task)
for index, step in enumerate(plan, start=1):
print(f"{index}. {step}")
print("checkpoint:", plan[-1])

期待される出力:

Terminal window
task: prepare a cited RAG demo answer
1. inspect question
2. retrieve sources
3. draft answer
4. check citations
checkpoint: check citations

良い planning は見えるものです。失敗を見つけやすくし、最後の文章の裏に隠さないようにします。

手順読む内容実践アウトプット
1LLM 推論答えを知ることと、道筋を導くことを区別する
2連鎖推論中間 state と self-check point を作る
3ReActthought、action、observation、次の一手を交互に行う
4Plan-and-Executeタスクが大きいとき計画と実行を分ける
5高度な計画dependency、priority、rollback、replan を扱う
6推論評価最終結果、経路品質、失敗タイプを採点する

このページを終えたら、この証拠カードを残します。

タスク目標
Agent が解決しようとしていること
計画またはトレース
推論手順、計画、ReAct trace、または実行グラフ
観察
各アクションの後に何が変わったか
失敗確認
幻覚のステップ、古い観測、ループ、または未検証の結論
評価アクション
期待結果と比較して計画を修正する

計画の失敗理由を、分解不足、ツール選択ミス、古い観察、チェックポイント不足、弱い最終検証として説明できれば、この章は合格です。

出口ミニプロジェクトは、1 つのタスクに対する見える推論 trace です:計画手順、観察、再計画、最終回答を残します。

確認の考え方と解説
  1. 合格レベルの答えでは、agent loop を goal、plan、tool call、observation、memory/state update、stop condition として説明します。
  2. 証拠には、最終回答だけでなく、別の開発者が確認できる trace を残します。
  3. tool schema、permission boundary、retry、evaluation case、人間レビューなど、安全性または信頼性の制御を1つ説明できれば十分です。