11.4.1 序列标注路线图：每个 Token 一个标签

序列标注为每个 token 预测一个标签。NER、分词、词性标注和槽位填充都属于这个思路。

先看标签路径

序列标注章节学习流程图

HMM CRF 序列历史图

BiLSTM CRF 标签路径图

关键输出不是一个句子标签，而是对齐 token 的标签，例如 B-PER、I-PER 和 O。

tokens = ["Ada", "Lovelace", "wrote", "notes"]
tags = ["B-PER", "I-PER", "O", "O"]

for token, tag in zip(tokens, tags):
    print(token, tag)

预期输出：

Ada B-PER
Lovelace I-PER
wrote O
notes O

如果分词变化，标签必须仍然对齐。很多序列标注 bug 本质上是对齐 bug。

如果你能检查 token/tag 对齐，并解释一个边界错误或非法标签转移，就通过了本章。

检查思路与讲解

学完这一页，至少保留这张证据卡：