一、BIO 三位标注 (B-begin,I-inside,O-outside)

B-X 代表实体X的开头, I-X代表实体的结尾 O代表不属于任何类型的

其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。

二、BMES 四位序列标注法

B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。

我/S 是/S 广/B 东/M 人/E (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)

我/ 是/ 广东人/ (标注上分出来的实体块)

三、BIOES (B-begin,I-inside,O-outside,E-end,S-single)

B 表示开始,I表示内部, O表示非实体 ,E实体尾部,S表示改词本身就是一个实体。

B表示这个词处于一个实体的开始(Begin), I 表示内部(inside), O 表示外部(outside), E 表示这个词处于一个实体的结束为止, S 表示,这个词是自己就可以组成一个实体(Single)

BIOES 是目前最通用的命名实体标注方法。

标签: 实体标注方法

添加新评论