8.5.1 项目路线图:构建带引用的知识助手
这个综合项目证明你能把知识、模型调用、应用流程和工程证据连接成一个可复现的大模型应用。
先看项目证据闭环



项目不是“连上向量数据库”。它是一个可追踪闭环:文档、分块、检索、上下文、回答、引用、日志、评估和改进。
跑一个项目就绪检查
提交项目前先用这张检查表。
project = {
"project_type": "knowledge-base assistant",
"documents": 5,
"eval_questions": 10,
"citations": True,
"empty_retrieval_handled": True,
"failure_cases": 3,
}
ready = (
project["documents"] >= 3
and project["eval_questions"] >= 10
and project["citations"]
and project["empty_retrieval_handled"]
and project["failure_cases"] >= 1
)
print("ready:", ready)
print("project_type:", project["project_type"])
print("evidence:", "docs, eval, citations, failures")
预期输出:
ready: True
project_type: knowledge-base assistant
evidence: docs, eval, citations, failures
如果 ready 是 False,先不要继续加功能。先补完证据闭环。
按这个顺序学
| 步骤 | 项目 | 真正训练的能力 |
|---|---|---|
| 1 | 企业或课程知识库 | 检索、权限、引用和可追踪回答 |
| 2 | 智能助手 | 把检索、会话状态和工具调用做成产品功能 |
| 3 | RAG + 微调系统 | 区分知识缺失和行为不稳定 |
| 4 | 课件生成助手 | 文档解析、结构化输出和模板渲染 |
| 5 | 完整实操工作坊 | 在真实 API 或数据库前先跑最小可复现闭环 |
如果需要带着做的基线,从 8.5.6 实操:完整第 8 章 RAG 应用工作坊 开始。
项目交付物标准
| 交付物 | 最低要求 | 更强的作品集版本 |
|---|---|---|
| README | 目标、运行命令、依赖和示例 | 增加架构图、设计取舍、成本和复盘 |
| 知识库样本 | 原始文档、chunks、metadata 和 source 字段 | 增加权限规则、文档版本和更新说明 |
| 检索日志 | 匹配片段、分数和排序 | 增加失败类型统计和前后对比 |
| 回答引用 | 最终回答显示支撑来源 | 增加引用忠实度检查 |
| 失败案例 | 至少 1 个记录下来的失败 | 增加 3 个以上案例,包含原因、修复和回归检查 |
| 评估 | 固定问题和通过/失败规则 | 增加基线、指标和回归测试 |
| 部署说明 | 如何运行和需要哪些环境变量 | 增加 Docker、监控和降级说明 |
通过标准
如果项目能带引用回答、展示检索日志、处理空检索、保留评估案例,并解释至少一个失败,就通过了本章。
最强作品集版本不一定最大。更重要的是,另一个开发者能复现运行、查看证据,并理解你下一轮会怎样改进。