同样的,输入是wordPiece tokenizer得到的 tokenid ,进入Bert预训练模型抽取丰富的文本特征得到 的输出向量,输出向量过 BiLSTM 从中提取实体识别所需的特征,得到 的向量,最终进入 CRF 层进行解码,计算最优的标注序列 N。
berttokenizer参数BERTTokenizer参数详解BERTTokenizer®HuggingFace公司提供的一个用于处理自然语言的Python库,它可以将文本序列转换为对应的token。
import torchfrom pytorch_pretrained_bert import BertTokenizer,BertModeltext0 = #39水果中很多对人有好处,比如苹果#39 #句子0text1 = #39外国手机有很多都不错,比如苹果#39 #句子1text2 = #39我喜欢在饭吃不同水果。
评论留言
暂时没有留言!