9.2.1 推理路线图:计划、行动、检查
Agent 推理不是更长的回答,而是生成可用中间步骤、决定下一步做什么,并检查计划是否还有效。
先看规划闭环
Section titled “先看规划闭环”


核心习惯是:规划一步、行动、观察结果、记录状态检查点,并在情况变化时重新规划。
跑一个计划检查表
Section titled “跑一个计划检查表”加工具之前先显式写出步骤。不能打印出来的计划,很难检查。
task = "prepare a cited RAG demo answer"plan = ["inspect question", "retrieve sources", "draft answer", "check citations"]
print("task:", task)for index, step in enumerate(plan, start=1): print(f"{index}. {step}")print("checkpoint:", plan[-1])预期输出:
task: prepare a cited RAG demo answer1. inspect question2. retrieve sources3. draft answer4. check citationscheckpoint: check citations好的规划应该可见,并让失败更容易定位,而不是把问题藏在最后一段话里。
按这个顺序学
Section titled “按这个顺序学”| 步骤 | 阅读 | 实操产出 |
|---|---|---|
| 1 | LLM 推理能力 | 区分知道答案和推导路径 |
| 2 | 链式推理 | 建立中间状态和自检点 |
| 3 | ReAct | 交替进行思考、行动、观察和下一步 |
| 4 | Plan-and-Execute | 任务变大时分离规划和执行 |
| 5 | 高级规划 | 处理依赖、优先级、回滚和重规划 |
| 6 | 推理评估 | 评估最终结果、路径质量和失败类型 |
学完这一页,至少保留这张证据卡:
- 任务目标
- Agent 想要解决什么
- 计划或轨迹
- 推理步骤、计划、ReAct 轨迹或执行图
- 观察
- 每次操作后发生了什么变化
- 失败检查
- 虚构步骤、过时观察、循环或未经验证的结论
- 评估动作
- 与期望结果对比并修正计划
如果你能说明一个计划为什么失败:拆解差、工具选错、观察过期、缺少检查点或最终验证太弱,就通过了本章。
本章出口小项目是一个可见推理 trace:包含计划步骤、观察、重规划和最终回答。
检查思路与讲解
- 合格答案要描述 agent 循环:目标、计划、工具调用、观察结果、记忆或状态更新,以及停止条件。
- 证据应包含另一个开发者可以检查的 trace,而不只是最终回答。
- 自检时要能说出一个安全或可靠性控制,例如工具 schema、权限边界、重试、评估用例或人工复核点。