中医药命名实体识别

基于BERT预训练语言和BiLSTM-CRF提供三个不同模型进行中医药领域的命名实体识别,并将预测结果通过不同的文本颜色输出。

模 型 介 绍

1. BERT-CRF:使用哈工大联合实验室开发的RoBERTa-wwm预训练语言模型,在中医药说明书数据集上微调再训练

2. BiLSTM-CRF:使用传统的BiLSTM-CRF模型完成命名实体识别

3. Stroke_char BiLSTM-CRF: 在输入模型的特征模块进行了改进,将汉字嵌入与笔画n-gram嵌入做融和输入后续训练模型,相比传统BiLSTM-CRF,有了一定的提升。

性能对比

感谢南开大学计算机学院2018级计算机科学与技术专业梁艺瑞同学的工作对本网站建设的支持。