PDF下载
基于远程监督的藏文实体关系抽取

王丽客1 孙媛2 夏天赐1

1.中央民族大学信息工程学院;2.中央民族大学国家语言资源监测与研究中心少数民族语言分中心

摘要: 关系抽取任务是对句子中的实体对进行关系分类。基于远程监督的关系抽取是用预先构建的知识库来对齐朴素文本,自动标注数据,在一定程度上减少了人工标注的成本,缓解了藏文材料语料不足的问题。但是基于远程监督的实体关系抽取还存在错误标记、提取特征时出现噪声等问题。该文用远程监督方法进行藏文实体关系抽取,基于已经构建的藏文知识库,利用分段卷积神经网络结构,加入语言模型和注意力机制来改善语义歧义问题以及学习句子的信息;在训练过程中加入联合得分函数来动态修正错误标签问题。实验结果表明改进的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
关键词: 藏文实体关系抽取;语言模型;注意力机制
DOI:
基金资助:
文章地址: