5.3.1 无监督学习路线图：没有标签时寻找结构

无监督学习从“数据没有标签”开始。模型不会告诉你最终真相，它只是帮助你发现可能存在的结构。

先看结构地图

无监督学习路线图

无监督学习章节流程

如果你想...	先用...
找自然分组	聚类
压缩高维数据	降维
找异常点	异常检测

关键问题不是“标签对不对”，而是“这个结构有没有证据、有没有意义”。

跑一个聚类 baseline

创建 unsupervised_first_loop.py，安装 scikit-learn 后运行。

from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

X, _ = make_blobs(n_samples=30, centers=3, random_state=7, cluster_std=0.8)

model = KMeans(n_clusters=3, random_state=7, n_init="auto")
labels = model.fit_predict(X)

print("cluster_count:", len(set(labels)))
print("first_five_labels:", labels[:5].tolist())
print("inertia:", round(model.inertia_, 2))

预期输出：

cluster_count: 3
first_five_labels: [2, 0, 0, 1, 0]
inertia: 43.44

聚类给的是组编号，不是人的解释。你还需要图表、特征汇总和业务解释。

按这个顺序学

顺序	阅读	练什么
1	5.3.2 聚类	K-Means、聚类解释、错误的簇数选择
2	5.3.3 降维	PCA、可视化、压缩
3	5.3.4 异常检测	离群点、阈值、告警证据

通过标准

能解释你想寻找哪种结构，能跑一个无监督模型，并写出一句谨慎解释，而不是把输出当成绝对真相，就算通过。

先看结构地图​

跑一个聚类 baseline​

按这个顺序学​

通过标准​

先看结构地图

跑一个聚类 baseline

按这个顺序学

通过标准