8.5.1 项目路线图：构建带引用的知识助手

这个综合项目证明你能把知识、模型调用、应用流程和工程证据连接成一个可复现的大模型应用。

先看项目证据闭环

大模型应用综合项目路线图

大模型应用项目学习顺序图

大模型应用项目交付闭环图

项目不是“连上向量数据库”。它是一个可追踪闭环：文档、分块、检索、上下文、回答、引用、日志、评估和改进。

跑一个项目就绪检查

提交项目前先用这张检查表。

project = {
    "project_type": "knowledge-base assistant",
    "documents": 5,
    "eval_questions": 10,
    "citations": True,
    "empty_retrieval_handled": True,
    "failure_cases": 3,
}

ready = (
    project["documents"] >= 3
    and project["eval_questions"] >= 10
    and project["citations"]
    and project["empty_retrieval_handled"]
    and project["failure_cases"] >= 1
)

print("ready:", ready)
print("project_type:", project["project_type"])
print("evidence:", "docs, eval, citations, failures")

预期输出：

ready: True
project_type: knowledge-base assistant
evidence: docs, eval, citations, failures

如果 ready 是 False，先不要继续加功能。先补完证据闭环。

按这个顺序学

步骤	项目	真正训练的能力
1	企业或课程知识库	检索、权限、引用和可追踪回答
2	智能助手	把检索、会话状态和工具调用做成产品功能
3	RAG + 微调系统	区分知识缺失和行为不稳定
4	SOP 文档助手	文档解析、结构化输出和模板渲染
5	完整实操工作坊	在真实 API 或数据库前先跑最小可复现闭环

如果需要带着做的基线，从 8.5.6 实操：完整第 8 章 RAG 应用工作坊开始。

项目交付物标准

交付物	最低要求	更强的作品集版本
README	目标、运行命令、依赖和示例	增加架构图、设计取舍、成本和复盘
知识库样本	原始文档、chunks、metadata 和 source 字段	增加权限规则、文档版本和更新说明
检索日志	匹配片段、分数和排序	增加失败类型统计和前后对比
回答引用	最终回答显示支撑来源	增加引用忠实度检查
失败案例	至少 1 个记录下来的失败	增加 3 个以上案例，包含原因、修复和回归检查
评估	固定问题和通过/失败规则	增加基线、指标和回归测试
部署说明	如何运行和需要哪些环境变量	增加 Docker、监控和降级说明

留下的证据

学完这一页，至少保留这张证据卡：

项目目标: 用户任务和业务边界
基线: 最简单的提示/RAG/应用版本优先
评估: 固定案例、检索证据、答案质量和引用检查
失败日志: 至少一个失败案例及其可能原因
交付物: README、运行命令、截图/日志、下一步

通过标准

如果项目能带引用回答、展示检索日志、处理空检索、保留评估案例，并解释至少一个失败，就通过了本章。

最强作品集版本不一定最大。更重要的是，另一个开发者能复现运行、查看证据，并理解你下一轮会怎样改进。

检查思路与讲解

合格答案要能追踪 query、chunks、检索分数、引用证据、最终回答和兜底行为。
证据应包含检索片段、source metadata、带引用的回答，以及至少一个空检索或误检索案例。
自检时要能判断失败来自 chunking、检索、排序、prompt 拼装、资料缺失，还是无依据生成。