9.7.7 实战：多 Agent 协作系统

多 Agent 协作实操运行图

学习目标

搭建一个最小多 Agent 协作闭环
学会让规划者、检索者、撰写者、审核者各司其职
看懂任务状态如何在多个角色之间流转
理解这个项目和单 Agent 系统相比真正多了什么

先定义项目目标

我们做一个最小研究型多 Agent 系统：

用户输入：

“请帮我总结退款政策的关键条件。”

系统内部角色：

规划者：拆任务
检索者：找资料
撰写者：写总结
审核者：检查结果

这个任务之所以合适，是因为它天然能拆工，而且每个角色职责很清楚。

先准备资料库

knowledge_base = {
    "退款政策": "课程购买后 7 天内且学习进度低于 20% 可申请退款。",
    "证书政策": "完成所有必修项目并通过测试后可获得结业证书。",
    "学习顺序": "建议先学 Python、数据分析、机器学习，再进入深度学习与大模型阶段。"
}

print(knowledge_base)

预期输出：

{'退款政策': '课程购买后 7 天内且学习进度低于 20% 可申请退款。', '证书政策': '完成所有必修项目并通过测试后可获得结业证书。', '学习顺序': '建议先学 Python、数据分析、机器学习，再进入深度学习与大模型阶段。'}

这就是系统要操作的最小知识来源。

定义四个 Agent

规划者

def planner_agent(user_query):
    if "退款" in user_query:
        return ["检索退款政策", "整理关键条件", "撰写总结", "审核输出"]
    return ["检索相关资料", "撰写总结", "审核输出"]

检索者

def retriever_agent(task):
    if "退款政策" in task:
        return knowledge_base["退款政策"]
    return "未找到资料"

撰写者

def writer_agent(evidence):
    return f"总结：{evidence}"

审核者

def reviewer_agent(draft):
    if "7 天内" in draft and "20%" in draft:
        return {"approved": True, "comment": "关键信息完整"}
    return {"approved": False, "comment": "缺少关键条件"}

把它们串起来

一个最小多 Agent 协作流程

请接着上面的知识库和四个 Agent 函数，在同一个 Python 文件或同一个解释器会话里运行。

def multi_agent_system(user_query):
    state = {
        "query": user_query,
        "plan": [],
        "evidence": None,
        "draft": None,
        "review": None
    }

    # 1. 规划
    state["plan"] = planner_agent(user_query)

    # 2. 检索
    state["evidence"] = retriever_agent(state["plan"][0])

    # 3. 写作
    state["draft"] = writer_agent(state["evidence"])

    # 4. 审核
    state["review"] = reviewer_agent(state["draft"])

    return state

result = multi_agent_system("请帮我总结退款政策的关键条件。")
for k, v in result.items():
    print(k, "->", v)

预期输出：

query -> 请帮我总结退款政策的关键条件。
plan -> ['检索退款政策', '整理关键条件', '撰写总结', '审核输出']
evidence -> 课程购买后 7 天内且学习进度低于 20% 可申请退款。
draft -> 总结：课程购买后 7 天内且学习进度低于 20% 可申请退款。
review -> {'approved': True, 'comment': '关键信息完整'}

多 Agent 状态交接结果图

这段代码已经说明了什么？

它已经说明：

多 Agent 不是简单多个函数
关键在状态流转
每个角色只负责自己那一段

这就是一个真正的最小多 Agent 系统。

让系统更像真实工作流

如果审核者不通过怎么办？

真实系统里，review 不通过后，通常不会直接结束。更合理的做法是：

把评审意见回传给撰写者
再修一版

一个带修订的小例子

继续在同一个文件或会话中运行，确保 multi_agent_system 和前面的 Agent 函数已经定义。

def reviser_agent(draft, review):
    if review["approved"]:
        return draft
    return draft + " 补充说明：退款还要求学习进度低于 20%。"

state = multi_agent_system("请帮我总结退款政策的关键条件。")
final_output = reviser_agent(state["draft"], state["review"])

print("draft :", state["draft"])
print("review:", state["review"])
print("final :", final_output)

预期输出：

draft : 总结：课程购买后 7 天内且学习进度低于 20% 可申请退款。
review: {'approved': True, 'comment': '关键信息完整'}
final : 总结：课程购买后 7 天内且学习进度低于 20% 可申请退款。

这一步很重要，因为它体现了：

多 Agent 系统的价值，不只是分工，还在于角色之间能形成迭代闭环。

加入更明确的任务日志

为什么项目里一定要有追踪？

如果系统答错了，你至少得知道：

规划者怎么拆的
检索者找到了什么
撰写者写了什么
审核者为什么没拦住

一个最小追踪版本

继续在同一个文件或会话中运行，确保四个 Agent 函数已经定义。

def traced_multi_agent_system(user_query):
    trace = []

    plan = planner_agent(user_query)
    trace.append({"agent": "planner", "output": plan})

    evidence = retriever_agent(plan[0])
    trace.append({"agent": "retriever", "output": evidence})

    draft = writer_agent(evidence)
    trace.append({"agent": "writer", "output": draft})

    review = reviewer_agent(draft)
    trace.append({"agent": "reviewer", "output": review})

    return trace

for step in traced_multi_agent_system("请帮我总结退款政策的关键条件。"):
    print(step)

预期输出：

{'agent': 'planner', 'output': ['检索退款政策', '整理关键条件', '撰写总结', '审核输出']}
{'agent': 'retriever', 'output': '课程购买后 7 天内且学习进度低于 20% 可申请退款。'}
{'agent': 'writer', 'output': '总结：课程购买后 7 天内且学习进度低于 20% 可申请退款。'}
{'agent': 'reviewer', 'output': {'approved': True, 'comment': '关键信息完整'}}

这个 trace 就是后面你调试和评估系统的重要基础。

为什么这个系统比单 Agent 更值得学？

因为它把问题拆开了

单 Agent 往往是一口气：

理解任务
检索
总结
自我检查

而多 Agent 把这些动作拆开后，你更容易：

观察每一层
替换其中一层
找到哪一层出错

但它也更贵、更复杂

所以真正的工程判断不是：

多 Agent 一定更高级

而是：

这个任务值不值得为“更可拆、可控”付出额外复杂度。

这个项目怎样继续升级？

你可以继续往上加：

更真实的检索器
多任务路由
异步通信
冲突裁决机制
失败重试

如果再继续做大，它就会越来越接近真实的多 Agent 产品系统。

初学者最常踩的坑

把所有角色都写得差不多

这样最后只是“多个名字不同的同一种 Agent”。

没有共享状态或追踪

一旦出错就很难查。

项目看起来热闹，但每个角色并没有真正分工

这是很多多 Agent 演示最常见的问题。

留下的证据

学完这一页，至少保留这张证据卡：

角色: 负责人、执行者、评审者，或专家职责
消息契约: artifact、request、response 和交接状态
协同: 路由、任务拆分、冲突解决和最终负责人
失败检查: 重复工作、上下文丢失、没有明确负责人或消息循环
评估动作: 将多 Agent 结果与单 Agent 基线对比

小结

这一节最重要的不是写出四个函数，而是理解：

多 Agent 项目的核心，是让每个角色围绕状态流转承担不同责任，并最终收敛成一个可解释、可迭代的工作流。

这才是多 Agent 真正比单 Agent 更有价值的地方。

练习

给这个系统再加一个 fact_checker_agent，专门核查数字条件。
让 planner_agent 针对“证书政策”也能产出不同计划。
想一想：如果审核者一直不通过，系统应该怎样限制修订轮数？
用自己的话解释：为什么说多 Agent 项目真正重要的是“状态流转”，而不是“角色数量”？

项目交付参考与讲解

fact_checker_agent 应接收 draft 和抽取出的数字条件，把每条 claim 与 source evidence 对照，并返回 pass/fail 状态和需要修改的具体 claim。
对 “certificate policy”，planner 应生成包含 policy retrieval、eligibility extraction、conflict checking、draft answer、reviewer verification 的计划，而不是盲目复用通用计划。
修改轮次应该有上限，例如最多两轮 review-revise。如果仍失败，系统应停止，报告未解决问题，并请求人工输入，而不是无限循环。
state transition 重要，是因为项目成功依赖每个阶段受控地改变系统状态：plan created、evidence collected、draft written、facts checked、review passed、final delivered。

9.7.7 实战：多 Agent 协作系统

学习目标

先定义项目目标

先准备资料库

定义四个 Agent

规划者

检索者

撰写者

审核者

把它们串起来

一个最小多 Agent 协作流程

这段代码已经说明了什么？

让系统更像真实工作流

如果审核者不通过怎么办？

一个带修订的小例子

加入更明确的任务日志

为什么项目里一定要有 追踪？

一个最小 追踪 版本

为什么这个系统比单 Agent 更值得学？

因为它把问题拆开了

但它也更贵、更复杂

这个项目怎样继续升级？

初学者最常踩的坑

把所有角色都写得差不多

没有共享状态或 追踪

项目看起来热闹，但每个角色并没有真正分工

留下的证据

小结

练习

为什么项目里一定要有追踪？

一个最小追踪版本

没有共享状态或追踪