メインコンテンツへスキップ

9.2.1 Reasoning ロードマップ:Plan、Act、Check

Agent reasoning は長い回答ではありません。使える中間手順を作り、次に何をするか決め、計画がまだ有効か確認する力です。

まず planning loop を見る

Agent reasoning and planning 章の学習順序図

Plan execute monitor replan map

Reasoning state checkpoint map

基本習慣は、1 step を計画し、実行し、結果を観察し、state checkpoint を残し、状況が変われば replan することです。

Plan checklist を動かす

tools を追加する前に、明示的な steps を作ります。print できない plan は inspect しにくいです。

task = "prepare a cited RAG demo answer"
plan = ["inspect question", "retrieve sources", "draft answer", "check citations"]

print("task:", task)
for index, step in enumerate(plan, start=1):
print(f"{index}. {step}")
print("checkpoint:", plan[-1])

出力:

task: prepare a cited RAG demo answer
1. inspect question
2. retrieve sources
3. draft answer
4. check citations
checkpoint: check citations

良い planning は見えるものです。失敗を見つけやすくし、最後の文章の裏に隠さないようにします。

この順番で学ぶ

手順読む内容実践アウトプット
1LLM reasoning答えを知ることと、道筋を導くことを区別する
2Chain reasoning中間 state と self-check point を作る
3ReActthought、action、observation、next step を交互に行う
4Plan-and-Executeタスクが大きいとき planning と execution を分ける
5Advanced planningdependency、priority、rollback、replan を扱う
6Reasoning evaluationfinal result、path quality、failure type を採点する

合格ライン

計画の失敗理由を、分解不足、tool 選択ミス、古い observation、checkpoint 不足、弱い最終検証として説明できれば、この章は合格です。

出口ミニプロジェクトは、1 つの task に対する見える reasoning trace です:plan steps、observations、replans、final answer を残します。