中英文文本标点恢复

实现功能包括中文日常、古文、中英混合文本的标点恢复。

将需要进行标点恢复的句子输入到对应位置内,点击开始按钮,得到结果。

技 术 路 线

以MacBERT+CRF为基础模型

进行微调

模型分为三部分:

  • embedding层

  • BertLayer(12个BertLayer层堆叠而成)

  • CRF层

通过对输入的无标点句子进行序列标注,完成标点恢复的任务。

感谢南开大学计算机学院2018级计算机科学与技术专业李毅同学的工作对本网站建设的支持。