民事一审判决书自动摘要

        判决书作为司法判决的载体对研究我国法律实践发展、促进法律实体正义与程序正义、提高司法效率具有重要意义。但由于判决书内容往往较长、非结构化、当事人关系复杂、事件类型多样等因素,往往难以高效快速的提取判决书中的要点。

        基于此,本文针对民事一审判决书提出“分割+抽取+生成”摘要自动生成模型。

Demo 介绍

专业

高效

准确

  • 用户可以输入整个判决书并通过程序对其自动进行分割,也可以手动将判决书分割后输入;

  • 通过“抽取式摘要”按钮,获得抽取式摘要;

  • 通过“生成式摘要”按钮,获得生成式摘要。

三 个 阶 段

  • 判决书文本分割阶段:基于正则规则提取出判决书中的重要信息;

  • 抽取式摘要阶段:基于NEZHA预训练模型抽取摘要;

  • 生成式摘要阶段:借鉴Unilm在生成式任务上的机制,仍然基于NEZHA预训练模型进行生成式摘要。

模 型 特 点

  • 基于判决书自身特点,统计正则规则对文本进行分割,降低文本长度的同时,帮助模型更好地学习各部分内容的特点;

  • 抽取、生成阶段统一采用NEZHA预训练模型,该模型由华为提出,在中文NLP任务上具有良好表现;

  • 相比于采用同样数据集(http://cail.cipsc.org.cn:2020/)的最好结果提升近16%。

感谢南开大学网络空间安全学院2017级信息安全、法学双学位班王冲同学的工作对本网站建设的支持。