跳转到内容

0.3 AI 全栈能力地图

AI 全栈能力地图

先看图。课程是一条工程路线:

toolsPythondatamodelsLLMRAGAgentspecialization/runtime delivery

现在不需要懂每个细节,只记住:

遇到的问题回到哪里
代码跑不起来工具和 Python
输入很乱数据
回答不可靠评估和 RAG
动作不可控Agent trace 和权限
层级对应章节第一个可见证据更深一层问题
工具1可复现项目文件夹和 Git 历史别人能不能重跑
Python2输入输出清楚的小脚本代码是否易读、有类型、可测试
数据3干净表格、图表和说明你是否知道数据哪里错、哪里偏
模型4-6训练或检查过的模型实验哪个指标会改变你的决策
LLM7prompt、token、embedding、Transformer 直觉行为来自数据、解码还是上下文
RAG8检索 trace 和回答评估答案有没有用对证据
Agent9工具 trace、权限、记忆边界、部署记录当用户、文件和动作都是真的,会在哪里失败
专项 / 运行时交付10-13 和选修视觉/NLP/多模态/开源大模型演示、导出资产、部署记录哪些领域与运行时约束会改变产品决策

这门课不是主题堆叠,而是一套调试栈,也是一套作品集栈。AI 应用表现不好时,原因可能藏在你正在看的功能下面好几层。当审阅者问你做了什么时,证据应该能说明你控制了哪些层。

一个适合转型的强项目,可以先从很小的助手或自动化开始,再随着章节一点点变可信。

层级要加入的作品集证据
工具仓库、README 命令、截图和清晰文件结构
Python有明确输入、输出、错误和测试的 CLI 或脚本
数据样本数据集、清洗笔记、图表和边界样例
模型baseline、指标表、对比和失败样本
LLMPrompt 变体、结构化输出、token/成本笔记和局限
RAG文档、chunk、检索 trace、引用检查和回答评估
Agent工具权限边界、动作 trace、记忆规则和回滚说明
专项 / 运行时交付视觉、NLP、多模态、开源大模型运行时、部署或产品专项审查证据

默认先按第 1-9 章走主线。完成第 9 章后,你应该能做出一个小型 LLM/RAG/Agent 项目,并留下证据、日志和安全边界。

然后按产品需要选择第 10-13 章:

需求选择原因
图像、摄像头、OCR、检测、分割第 10 章 计算机视觉输出是视觉结果:标签、框、mask、文字或视频事件
文本标签、信息抽取、摘要、语言评估第 11 章 NLP输出是文本任务:标签、字段、span 或生成文本
图片、PDF、音频、视频、创意资产、多模态 RAG第 12 章 多模态/AIGC工作流混合多种模态,需要来源、prompt、审查和导出记录
开源模型托管、私有化部署、运行时掌控第 13 章 开源大模型部署项目必须控制模型文件、服务 API、许可证、成本和微调决策
部署、进阶 Python、经典 ML 深度选修模块主项目需要某个具体工程或算法旁支能力

开始项目之前,先标出风险最高的层。比如 PDF 问答应用通常先坏在数据清洗和检索,不是聊天界面。自动化 Agent 通常先坏在工具权限、状态和评估,不是 prompt 用词。

每章都要留下一个能证明这一层可用的产物。截图有帮助,但日志、README 命令、小数据集、指标表和失败笔记更强,因为它们之后还能帮助你排错。

可选背景:如果想知道这些能力是怎样发展出来的,可以快速看一眼 AI 15 阶段发展史

下一步,规划你推进主线的节奏。

学完这一页,至少保留这张证据卡:

能力映射
工具、Python、数据、数学、ML、DL、LLM、RAG、Agent、专项和运行时链接
项目线
一个助手、自动化、分析或多模态项目想法
当前位置
你已经知道什么,以及你会暂时搁置什么
下一步
本周开始一个具体的章节或工作坊
风险检查
一次学太多、跳过证据,或丢失主路线
期望产出
一份标注过的个人课程地图、一条项目线和一个即时行动