跳转到内容

5.6.1 机器学习项目路线图:baseline、证据、改进

本小章是第 5 章出口。它证明你能把一个数据问题变成可评估、可解释、可展示的建模流程。

机器学习项目实践路线图

机器学习项目作品集闭环

记住这个项目闭环:

问题数据baseline指标改进失败样本报告

不要一开始就冲复杂模型。没有 baseline、指标和失败分析的项目,只是一次演示性运行。

创建 ml_project_log_first_loop.py。这不是模型,而是每个模型项目都需要的习惯。

experiments = [
{"version": "v1_baseline", "metric": 0.72, "change": "default model"},
{"version": "v2_features", "metric": 0.78, "change": "add ratio features"},
{"version": "v3_tuned", "metric": 0.80, "change": "tune max_depth"},
]
best = max(experiments, key=lambda row: row["metric"])
print("best_version:", best["version"])
print("best_metric:", best["metric"])
print("next_step: inspect failure cases before adding more models")

预期输出:

Terminal window
best_version: v3_tuned
best_metric: 0.8
next_step: inspect failure cases before adding more models

这一步是在转换思维:从“我跑了模型”变成“我能比较版本并解释下一步”。

顺序阅读交付什么
15.6.2 房价预测回归 baseline 和改进
25.6.3 客户流失预测分类指标和阈值思维
35.6.4 用户分群聚类解释和业务标签
45.6.5 Kaggle 实践真实提交流程
55.6.6 ML 实操工作坊一份完整证据包演练

工作坊放在最后,因为它把前面项目习惯整理成一份可复现证据包。

机器学习项目报告分镜图

至少为一个项目保留这些文件:README.md、运行命令、指标表、实验记录、一个失败样本、一张图、下一步计划。

能说清:我如何定义任务、用了什么 baseline、信任哪个指标、哪里变好了、模型在哪里失败、下一步做什么,就算通过。

检查思路与讲解
  1. 完整回答要先定义任务类型、目标列和成功指标,再讨论模型名称。
  2. baseline 应该是最简单、可复现的一版:固定划分、最少预处理、一个模型和一张指标表。
  3. 改进必须和同一个划分或验证方案比较。一次同时改划分和模型,结果就很难解释。
  4. 失败分析至少要指出一个模型较弱的样本类型或业务分段,并把它变成下一轮受控实验。
  5. 合格的项目文件夹应该包含运行命令、README、实验日志、指标表、图表、失败样本和下一步计划。

学完这一页,至少保留这张证据卡:

项目目标
预测、分割、Kaggle,或端到端 ML 作品集目标
流水线
数据划分、预处理、模型、评估和报告工件
结果
指标表、图表、预测、失败样本和 README 说明
失败检查
运行不可复现、泄漏、过拟合、基线薄弱或缺少部署边界
期望产出
包含流水线、指标和失败复盘的 ML 项目文件夹