7.5.1 Prompt 工程路线图:任务简报、输出、评测
Prompt 工程是应用和模型之间的接口。目标不是写一句聪明的话,而是让一次模型调用变得可预测、可解析、可测试、可持续改进。
先看 Prompt 闭环
Section titled “先看 Prompt 闭环”


当模型大致有能力,但结果含糊、不稳定、格式不对或难以评估时,就优先使用本章的方法。
跑一个 Prompt 合约检查
Section titled “跑一个 Prompt 合约检查”调用任何 LLM 之前,先把 Prompt 写成一个合约:任务、上下文、输出格式和约束。下面的小脚本检查这个合约是否完整到可以测试。
prompt_contract = { "task": "Extract chapter metadata", "context": "One course markdown file", "output_format": ["chapter", "goals", "prerequisites", "risks"], "constraints": ["return JSON only", "mark missing facts as null"],}
required = ["task", "context", "output_format", "constraints"]missing = [field for field in required if not prompt_contract.get(field)]
print("ready:", not missing)print("fields:", ", ".join(required))print("test_case_count:", 3)预期输出:
ready: Truefields: task, context, output_format, constraintstest_case_count: 3
如果 ready 是 False,先补完整任务简报,再继续试更多样例。模糊的 Prompt 会带来模糊的调试。
按这个顺序学
Section titled “按这个顺序学”| 步骤 | 阅读 | 实操产出 |
|---|---|---|
| 1 | Prompt 基础 | 把一个模糊需求改写成任务、上下文、格式、约束 |
| 2 | 进阶 Prompt | 只在有帮助时加入示例、步骤、角色和边界说明 |
| 3 | 结构化输出 | 生成可被程序解析的 JSON、表格或 Markdown |
| 4 | Prompt 实战 | 在同一批固定输入上比较 Prompt 版本 |
| 5 | 评测实验室 | 记录通过率、失败类型和下一次修改 |
学完这一页,至少保留这张证据卡:
- 提示词契约
- 任务、上下文、约束、输出格式
- 固定案例
- 不同提示版本使用相同输入
- 架构检查
- 结构化输出已通过解析器验证
- 失败备注
- 按原因分组的提示词失败
- 桥接
- 第 8 章把检索到的上下文加入这个循环
如果你能固定输入集,每次只改一个 Prompt 层,并用证据说明新版本为什么更好,而不是凭感觉判断,就通过了本章。
本章出口小项目是课程内容抽取 Prompt:输入一篇课程文档,输出章节主题、学习目标、前置知识、关键术语、练习建议和风险提醒,格式为 JSON 或 Markdown 表格。
检查思路与讲解
- 合格答案要说明 token、上下文、attention、prompt 和生成行为如何组成一次请求到回答的路径。
- 证据至少包含一个可复现 prompt 或结构化输出测试,并说明输出为什么通过或失败。
- 自检时要区分 prompt、RAG、微调和对齐:优先使用能解决已观察问题的最轻方案。