9 AI Agent 与智能体系统

AI Agent 系统主视觉

第 8 章让模型能基于文档回答。第 9 章让系统围绕目标行动：规划下一步、调用工具、读取观察结果、调整路线、安全停止，并留下人能复盘的 trace。

不要从多 Agent 框架开始。先做一个能展示每一步的小 Agent。

Agent 为什么会出现：从脚本到会观察的系统

Agent 不是“更高级的聊天机器人”，而是自动化系统一路演进后遇到不确定任务时的形态。可以先记住这条线：

固定脚本工作流函数/工具调用ReAct 工具循环Agent

阶段	适合解决什么	什么时候不够
固定脚本	步骤完全确定、输入格式稳定的重复任务	环境变化后脚本容易失败
工作流	有分支、有审批、有固定业务流程的任务	每一步都需要提前设计好
函数/工具调用	LLM 选择一次结构化工具，例如查天气、查订单	只做一次动作，不适合多步观察和调整
ReAct 工具循环	边想边调用工具，读取观察结果后继续下一步	需要状态、权限、停止条件和追踪记录
Agent	面向目标持续规划、调用工具、观察、修正和停止	风险更高，必须有边界、日志和人工接管

所以本章先教单 Agent 的可追踪闭环，再讨论框架和多 Agent。一个可靠 Agent 的关键不是“会不会显得聪明”，而是能不能解释每一步为什么做、做了什么、如何停止。

你在主线中的位置

你已经做过大模型回答闭环和 RAG 证据闭环。这一章会加入受控行动：系统决定下一步、调用允许的工具、读取观察结果、更新状态，并带着可回放 trace 安全停止。

这是主线中的最后一个核心应用层。学完本章后，第 10-12 章会变成产品专项，第 13 章补上开源模型运行时掌控：视觉、NLP、多模态工作流和自部署 LLM 都可以接入同一套证据、工具、trace 和安全习惯。

先看 Agent 执行闭环

Agent 执行闭环

Agent 不是“给聊天机器人加工具”，而是一个受控执行闭环。

部分	通俗含义	必须控制什么
目标	Agent 要完成的目标	范围、成功标准、停止条件
状态（State）	当前已经知道什么	当前输入、历史观察、剩余步骤
计划（Plan）	下一步准备做什么	最大步数、兜底路径、人工接管
工具（Tool）	搜索、读文件、调 API、跑代码等外部动作	结构约束、校验、白名单、风险等级
观察	工具返回的结果	错误处理、重试规则、可信边界
记忆（Memory）	哪些信息跨步骤或跨运行保留	短期状态和长期偏好的边界
追踪记录（追踪）	可回放的执行记录	目标、动作、参数、观察、成本、最终结果

学习顺序与任务表

先把单 Agent 做到可追踪，再学多 Agent。优先走单 Agent 核心路径：9.1 -> 9.2 -> 9.3 -> 9.4 -> 9.8 -> 9.10。MCP、框架、多 Agent 和部署运维作为高级章节，在单 Agent 闭环稳定后再学。

步骤	阅读内容	要动手做什么	留下什么证据
9.1	Agent 基础与架构	解释目标、状态、计划、工具、观察、记忆	一张架构草图
9.2	推理与规划	用同一任务比较 ReAct 和 Plan-and-Execute	一份步骤追踪
9.3	工具调用	定义一两个带参数和错误的工具	`tools_schema.md`
9.4	记忆	区分当前状态和长期记忆	记忆边界说明
9.8	评估与安全	给输出打分、拦截风险动作、检查追踪记录	追踪日志、安全拦截、评估用例
9.10	阶段项目	运行 9.10.5 实操：构建一个可追踪的单 Agent 助手	`agent_traces.jsonl`、安全边界、评估用例
9.5	MCP 与协议层	把 MCP 和 Agent 交接契约理解成连接工具、数据源和 peer agent 的方式	一张能力卡和一份接入笔记
9.6-9.7	框架与多 Agent	单 Agent 闭环稳定后再学	框架选择说明
9.9	部署与运维	核心项目跑通后，再加入运行时、恢复、成本和生产检查	发布清单和回滚说明

必修主线、扩展和深度挑战

必修核心

先学单 Agent 闭环、工具结构约束、白名单、最大步数、状态边界、记忆边界、追踪日志、安全拦截和评估用例。这是构建可复盘 Agent 的最小能力，而不只是做一个演示。

可选扩展

等单 Agent 闭环稳定后，再回到 MCP、框架比较、多 Agent 协作、部署运维和成本优化。它们适合项目需要集成或规模化时再加入。

深度挑战

用同一个任务分别做成工作流、RAG 流程、函数调用和 Agent 追踪，再说明哪个是最简单安全设计。这样可以避免为了赶潮流而使用 Agent。

时间预算与交付物

**快速通过：**完成一个可追踪 Agent 闭环，并拦截一个不安全工具。留下 agent_traces.jsonl 和一段追踪说明。

**标准完成：**完成核心路径 9.1 -> 9.2 -> 9.3 -> 9.4 -> 9.8 -> 9.10。留下 tools_schema.md、safety_boundary.md、评估用例和一个失败 trace。

**深度完成：**单 Agent 稳定后，再增加 MCP、框架比较、部署准备或多 Agent 协作。留下设计备忘，说明为什么 Agent 比 workflow、RAG 或 function calling 更安全或更有用。

强的第 9 章成果要证明“可控”：Agent 被允许做什么、不允许做什么、如何停止，以及审阅者怎样回放 trace。

第一个可运行循环：先打印追踪

这个离线脚本不依赖 LLM。它训练的是工程习惯：每个动作都必须可回放。后面可以把固定 plan 换成模型生成的计划，但 trace 格式要保留。

新建 ch09_agent_trace.py，用 Python 3.10 或更新版本运行。

import json


def search_docs(tool_input: dict) -> str:
    return "Found notes about RAGOps, AgentOps, evaluation sets, and trace logs."


def make_todo(tool_input: dict) -> str:
    topic = tool_input["topic"]
    return f"1) Review {topic} notes; 2) add one eval case; 3) write failure notes."


TOOLS = {
    "search_docs": {"fn": search_docs, "risk": "read_only"},
    "make_todo": {"fn": make_todo, "risk": "draft_only"},
}

goal = "Prepare a short RAG review plan."
plan = [
    {
        "thought": "Find relevant course materials before making a plan.",
        "action": "search_docs",
        "input": {"query": "RAGOps AgentOps evaluation trace"},
    },
    {
        "thought": "Turn the materials into a small review checklist.",
        "action": "make_todo",
        "input": {"topic": "RAG evaluation"},
    },
]

trace = []
for step_number, step in enumerate(plan, start=1):
    tool = TOOLS.get(step["action"])
    if tool is None:
        observation = "Blocked: tool is not whitelisted."
        risk = "blocked"
    else:
        observation = tool["fn"](step["input"])
        risk = tool["risk"]

    trace.append(
        {
            "step": step_number,
            "goal": goal,
            "thought": step["thought"],
            "action": step["action"],
            "input": step["input"],
            "risk": risk,
            "observation": observation,
        }
    )

for item in trace:
    print(json.dumps(item, ensure_ascii=False))

预期输出开头如下：

{"step": 1, "goal": "Prepare a short RAG review plan.", "thought": "Find relevant course materials before making a plan.", "action": "search_docs", ...
{"step": 2, "goal": "Prepare a short RAG review plan.", "thought": "Turn the materials into a small review checklist.", "action": "make_todo", ...

操作提示：把 make_todo 改成白名单外工具名，比如 send_email。脚本应该拦截它。这就是安全边界的最小版本。

深度阶梯

层级	你能证明什么
最低通过	能运行一条追踪记录，并解释每个目标、动作、输入、观察和结果。
项目可用	能定义工具结构约束、拦截白名单外工具、设置最大步数，并保存失败追踪记录。
深度检查	能判断什么时候工作流比 Agent 更安全，以及高风险动作应该在哪里加入人工确认。

选择 Agent、工作流、RAG 还是函数调用

Agent 边界选择图

Agent 很强，但不应该默认使用。

问题	先用什么	什么时候用 Agent
步骤固定且已知	工作流	每次观察后路线都可能变化
答案需要私有或新知识	RAG	检索只是更大目标中的一步
一次结构化动作就够	函数调用	需要多次工具调用和状态更新
任务风险高	带人工确认的工作流	Agent 可以起草，但高风险动作必须人确认
探索任务需要规划、工具、记忆和恢复	Agent	能记录每一步，并能安全停止

留下的证据

学完这一页，至少保留这张证据卡：

核心路线: 先走 9.1 → 9.2 → 9.3 → 9.4 → 9.8 → 9.10
智能体循环: 目标 → 计划 → 工具/动作 → 观察 → 记忆 → 评估
追踪规则: 每个动作都应留下输入、输出、决策和错误记录
协议规则: 工具发现、授权和 Agent 交接要有能力卡
安全规则: 权限、工具边界、沙箱护栏，以及回滚都是设计的一部分
深度拆分: 在单 Agent 循环稳定后，再处理 MCP/框架/多 Agent/部署

常见错误

单 Agent 还不稳定，就开始做多 Agent。
调工具时没有结构约束、参数校验或有用的错误信息。
缺少停止条件，导致循环和成本飙升。
高风险工具没有人工确认就自动执行。
只展示成功演示，不保留失败追踪记录。
把记忆当杂物箱，而不是区分当前状态、长期偏好和任务历史。

通关检查

离开本章前，你应该能做到：

解释 goal、state、plan、tool、observation、memory、追踪和 guardrail；
运行追踪脚本，并拦截一个不在白名单里的工具；
保存 agent_traces.jsonl、tools_schema.md、protocol_card.md、safety_boundary.md 和 failure_cases.md；
判断任务应该用工作流、RAG、函数调用还是 Agent；
跑通第 9 章完整工作坊，并新增一个评估任务和一个安全拦截样例。

可打印清单见 9.0 学习检查表。如果想直接做项目，从 9.10.5 实操：构建一个可追踪的单 Agent 助手开始。