11.3.1 文本分类路线图:文本输入、标签输出
文本分类接收一段文本,预测一个标签,例如情感、主题、意图或风险类型。
先看分类流水线
Section titled “先看分类流水线”


复杂模型之前先做基线。大多数分类问题不是模型不够强,而是标签模糊或样本分布偏。
跑一个关键词基线
Section titled “跑一个关键词基线”texts = ["great course and clear examples", "confusing setup error"]positive_words = {"great", "clear", "good", "useful"}
for text in texts: score = sum(word in positive_words for word in text.split()) label = "positive" if score > 0 else "needs_review" print(label, "-", text)预期输出:
positive - great course and clear examplesneeds_review - confusing setup error简单基线不是最终模型,但能快速暴露标签规则和失败案例。
按这个顺序学
Section titled “按这个顺序学”| 步骤 | 阅读 | 实操产出 |
|---|---|---|
| 1 | 传统方法 | 构建 TF-IDF 或关键词基线 |
| 2 | 深度学习方法 | 比较 embeddings、pooling、CNN/RNN/Transformer 特征 |
| 3 | 项目实战 | 追踪划分、指标、标签歧义和错误样例 |
如果你能训练或模拟一个分类器,报告 accuracy/F1,并解释至少一个标签模糊案例,就通过了本章。
检查思路与讲解
- 合格答案要从文本单元和输出类型说起:token、span、句子标签、序列、embedding 或生成文本。
- 证据应包含小样本、模型或 pipeline 选择、评价指标,以及至少一个被检查过的错误案例。
- 自检时要能区分预处理问题和模型问题,例如分词错误、标签歧义、数据不平衡或生成幻觉。
学完这一页,至少保留这张证据卡:
- 标签模式
- 标签定义和边界示例
- 数据集划分
- 固定的训练/测试示例或评估集
- 预测
- 预测标签、期望标签以及置信度或分数
- 失败检查
- 类别不平衡、标签重叠、数据泄漏或措辞混淆
- 期望产出
- 按失败原因分组的指标和错误样本