面向司法案件的案情知识图谱自动构建
洪文兴1 胡志强1 翁洋2 张恒3 王竹4 郭志新5
1.厦门大学航空航天学院;2.四川大学数学学院;3.成都星云律例科技有限责任公司;4.四川大学法学院;5.电子科技大学公共管理学院
摘要: 以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计。针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,该文提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习。在"机动车交通事故责任纠纷"案由下,和基准模型相比,实体识别的F1值可提升0.36,关系抽取的F1值提升高达2.37。以此为基础,该文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑。
关键词:
司法案件;知识图谱;实体识别;关系抽取;
司法案件;知识图谱;实体识别;关系抽取