A.5 硬件与云资源指南


一句话结论:不要一开始就买 GPU。先看任务,再决定用本地 CPU、云 GPU,还是 API。
快速决策表
| 学习阶段 | 本地需要 | 卡住时更好的选择 |
|---|---|---|
| 第 1-5 章:工具、Python、数据、数学、经典 ML | 8-16GB 内存,SSD | 通常不需要 GPU |
| 第 6 章:深度学习基础 | 16GB 内存 | 训练练习用云 GPU |
| 第 7 章:大模型原理与微调概念 | 16-32GB 内存 | 云 GPU 或 API 实验 |
| 第 8-9 章:RAG 与 Agent | 16GB 内存,稳定网络 | API 优先的工程路线 |
| 第 10-11 章:CV 与 NLP | 16GB 内存 | 较重实验用云 GPU |
| 第 12 章:多模态 | 16-32GB 内存 | 云端生成或 API 服务 |
购买优先级
大多数学习者按这个顺序花钱更稳:
- 内存:最低 16GB,舒服 32GB。
- SSD:最低 512GB,舒服 1TB。
- 稳定环境:干净的 Python、Node、Docker 和项目目录。
- 显示和输入体验:外接显示器、键盘、鼠标。
- GPU:只有知道真实负载后再买。
什么时候用云端或 API
| 选项 | 最适合什么 | 注意什么 |
|---|---|---|
| 免费 notebook | 小 demo 和熟悉流程 | 时间限制、可用性不稳定 |
| 按小时云 GPU | 已有明确代码和数据的训练实验 | 先准备好,跑完立刻关机 |
| API 优先路线 | RAG、Agent、助手、产品项目 | 日志、成本、隐私、重试 |
| 本地 GPU | 长期频繁训练和快速本地迭代 | 显存、散热、电源、总成本 |
什么时候本地 GPU 值得买
至少满足两条再考虑:
- 未来几个月会频繁训练模型。
- 云端排队或时间限制每周都影响你。
- 你已经知道模型规模、batch size 和显存需求。
- 你更需要快速本地迭代,而不是低前期成本。
如果理由只是“以后可能会用到”,先等等。
实用方案
用现有电脑完成第 1-5 章。第 6、10、11 章真正需要训练时再租云 GPU。第 8-9 章优先做 API 工程项目。等项目负载证明你真的需要,再决定是否买本地 GPU。