跳转到内容

9.0 学习检查表:AI Agent 与智能体系统

这页当成可打印检查表使用。需要完整讲解时,回到 第 9 章入口页

Agent 追踪 证据包

时间做什么能说出这句话就停
20 分钟看入口页的执行闭环“Agent 是 goal-state-tool-observation 循环。”
25 分钟运行 追踪 脚本“我能回放每个动作和观察。”
25 分钟浏览 9.1 和 9.2“我能区分 Agent、工作流、RAG、ReAct、Plan-and-Execute。”
25 分钟浏览 9.3 工具安全“工具 结构约束 和权限比花哨 Prompt 更重要。”
25 分钟阅读边界选择图“我知道什么时候不该用 Agent。”
证据最小版本
tools_schema.md1~2 个工具,写清名称、用途、参数、返回值、错误和风险等级
agent_traces.jsonl至少三次运行,记录 goal、步骤、action、input、observation、result
safety_boundary.md最大步数、工具白名单、被拦截动作、人工确认规则
failure_cases.md至少三个失败:选错工具、参数错误、循环、权限拦截、不支持的回答
eval_tasks.csv3~5 个固定任务,包含期望结果和成功标准
README.md运行命令、追踪 示例、安全样例、评估结果、限制
闸门通过条件
工具 结构约束每个工具都有用途、参数、返回值、错误和风险等级。
轨迹回放(追踪回放)评审者可以回放每次工具调用为什么发生。
安全边界白名单外或高风险动作会被拦截,或转入人工确认。
停止控制最大步数和停止条件能防止循环与成本失控。

预期结果:你的第 9 章项目文件夹里有工具 schema、可回放 trace、安全边界、固定评测任务、失败笔记,以及说明为什么在闭环可靠前保持单 Agent 的 README。

  • 你能说明 Agent 和普通 LLM 应用的区别吗?
  • 你能展示一条 追踪,并解释每次工具调用为什么发生吗?
  • 你能拦截高风险或不在白名单里的工具吗?
  • 你能定义停止条件和最大步数吗?
  • 你能解释为什么多 Agent 应该在单 Agent 可靠之后再做吗?
检查思路与讲解
  1. Agent 会维持 goal-plan-tool-observation 的闭环,所以系统不只是生成一句回答,而是能执行、观察结果并决定下一步。
  2. 有用的 trace 应该包含 goal、plan step、tool call、input、observation,以及为什么下一步会由这个 observation 触发。
  3. 可以通过 tool allowlist、schema 检查、risk label、最大步数和必要时的人类审批,来拦截高风险或不在白名单里的工具。
  4. 好的停止条件包括成功、没有进展、达到最大步数,或者风险升级。
  5. 先把单 Agent 做稳定,是因为多 Agent 更难追踪、更难调试,也更难安全控制。

如果答案都是可以,就继续下一方向:部署、多模态 Agent,或课程最终项目。

学完这一页,至少保留这张证据卡:

单代理 trace
一个完整的目标-计划-行动-观察循环
工具契约
schema、权限、错误行为和观察
记忆笔记
写入、检索、遗忘或更新了什么
评估备注
成功分数、安全检查和失败原因
项目说明
运行命令、trace、限制,以及下一步动作