0.3 AI 全栈能力地图

AI 全栈能力地图

先看图。课程是一条工程路线：

toolsPythondatamodelsLLMRAGAgentspecialization/runtime delivery

现在不需要懂每个细节，只记住：

七层能力

层级	对应章节	第一个可见证据	更深一层问题
工具	1	可复现项目文件夹和 Git 历史	别人能不能重跑
Python	2	输入输出清楚的小脚本	代码是否易读、有类型、可测试
数据	3	干净表格、图表和说明	你是否知道数据哪里错、哪里偏
模型	4-6	训练或检查过的模型实验	哪个指标会改变你的决策
LLM	7	prompt、token、embedding、Transformer 直觉	行为来自数据、解码还是上下文
RAG	8	检索 trace 和回答评估	答案有没有用对证据
Agent	9	工具 trace、权限、记忆边界、部署记录	当用户、文件和动作都是真的，会在哪里失败
专项 / 运行时交付	10-13 和选修	视觉/NLP/多模态/开源大模型演示、导出资产、部署记录	哪些领域与运行时约束会改变产品决策

这门课不是主题堆叠，而是一套调试栈，也是一套作品集栈。AI 应用表现不好时，原因可能藏在你正在看的功能下面好几层。当审阅者问你做了什么时，证据应该能说明你控制了哪些层。

一个适合转型的强项目，可以先从很小的助手或自动化开始，再随着章节一点点变可信。

层级	要加入的作品集证据
工具	仓库、README 命令、截图和清晰文件结构
Python	有明确输入、输出、错误和测试的 CLI 或脚本
数据	样本数据集、清洗笔记、图表和边界样例
模型	baseline、指标表、对比和失败样本
LLM	Prompt 变体、结构化输出、token/成本笔记和局限
RAG	文档、chunk、检索 trace、引用检查和回答评估
Agent	工具权限边界、动作 trace、记忆规则和回滚说明
专项 / 运行时交付	视觉、NLP、多模态、开源大模型运行时、部署或产品专项审查证据

默认先按第 1-9 章走主线。完成第 9 章后，你应该能做出一个小型 LLM/RAG/Agent 项目，并留下证据、日志和安全边界。

然后按产品需要选择第 10-13 章：

需求	选择	原因
图像、摄像头、OCR、检测、分割	第 10 章计算机视觉	输出是视觉结果：标签、框、mask、文字或视频事件
文本标签、信息抽取、摘要、语言评估	第 11 章 NLP	输出是文本任务：标签、字段、span 或生成文本
图片、PDF、音频、视频、创意资产、多模态 RAG	第 12 章多模态/AIGC	工作流混合多种模态，需要来源、prompt、审查和导出记录
开源模型托管、私有化部署、运行时掌控	第 13 章开源大模型部署	项目必须控制模型文件、服务 API、许可证、成本和微调决策
部署、进阶 Python、经典 ML 深度	选修模块	主项目需要某个具体工程或算法旁支能力

开始项目之前，先标出风险最高的层。比如 PDF 问答应用通常先坏在数据清洗和检索，不是聊天界面。自动化 Agent 通常先坏在工具权限、状态和评估，不是 prompt 用词。

每章都要留下一个能证明这一层可用的产物。截图有帮助，但日志、README 命令、小数据集、指标表和失败笔记更强，因为它们之后还能帮助你排错。

可选背景：如果想知道这些能力是怎样发展出来的，可以快速看一眼 AI 15 阶段发展史。

下一步，规划你推进主线的节奏。

学完这一页，至少保留这张证据卡：