9.10.1 项目路线图:构建可追踪 Agent
Agent 项目作品集应该展示可追踪执行闭环,而不是只展示一个最终模型回答。
先看项目闭环
Section titled “先看项目闭环”


闭环是:目标、计划、工具调用、观察、状态更新、失败处理、停止决策、最终输出、评估。
跑一个 Agent 证据检查
Section titled “跑一个 Agent 证据检查”在称为作品集项目之前先跑这个检查。
project = { "goal_defined": True, "trace_saved": True, "tool_logs": True, "failure_case": True, "eval_tasks": 10,}
ready = ( project["goal_defined"] and project["trace_saved"] and project["tool_logs"] and project["failure_case"] and project["eval_tasks"] >= 5)
print("portfolio_ready:", ready)print("evidence:", "goal, trace, tools, failure, eval")预期输出:
portfolio_ready: Trueevidence: goal, trace, tools, failure, eval如果这里输出 False,先补证据,再增加更多 Agent 角色。
按这个顺序学
Section titled “按这个顺序学”| 步骤 | 项目 | 真正训练的能力 |
|---|---|---|
| 1 | 研究助手 | 检索、引用、总结、可信输出 |
| 2 | 数据分析 Agent | Python 工具调用、表格分析、图表、解释 |
| 3 | 多 Agent 开发团队 | 角色分工、交接、评审闭环、合并负责人 |
| 4 | 实操工作坊 | 最小可追踪单 Agent 基线 |
扩展项目前,先运行 9.10.5 实操:构建可追踪单 Agent 助手。
项目交付物标准
Section titled “项目交付物标准”| 交付物 | 最低要求 | 更强的作品集版本 |
|---|---|---|
| README | 目标、运行命令、依赖、示例 | 增加架构、取舍、成本、安全和复盘 |
| 架构 | 模型、工具、记忆、状态、评估、安全 | 增加部署边界和人工交接 |
| 工具清单 | 可调用工具、输入/输出 结构约束、失败情况 | 增加权限规则和沙箱说明 |
| 执行 追踪 | 计划、行动、观察、重规划、停止 | 增加可重放 JSONL 日志 |
| 失败案例 | 至少 1 个真实失败 | 增加 3 个案例,包含原因、修复、回归检查 |
| 评估集 | 固定任务和通过/失败规则 | 增加基线、指标和对比实验 |
| 部署说明 | 如何本地运行 | 增加 API 入口、环境变量、监控和回滚 |
学完这一页,至少保留这张证据卡:
- 项目目标
- 智能体应完成什么,以及必须不做什么
- 基线
- 在加入高级功能前的单智能体循环
- 追踪包
- 目标、计划、tool 调用、观察、记忆、评估
- 失败日志
- 一次失败或不安全的运行及其根因
- 交付物
- README、运行命令、trace 截图/日志、下一步
如果另一个开发者能重放你的 Agent 运行,检查每次工具调用和观察,理解它为什么停止,并看到至少一个失败分析,就通过了本章。
基础版可以是单 Agent 项目。只有当 trace 和评估闭环稳定后,再加入记忆、MCP、多 Agent 协作或部署。
检查思路与讲解
- 合格答案要描述 agent 循环:目标、计划、工具调用、观察结果、记忆或状态更新,以及停止条件。
- 证据应包含另一个开发者可以检查的 trace,而不只是最终回答。
- 自检时要能说出一个安全或可靠性控制,例如工具 schema、权限边界、重试、评估用例或人工复核点。