PDF下载
基于上下文词向量和主题模型的实体消歧方法

王瑞 李弼程 杜文倩

华侨大学计算机科学与技术学院

摘要: 传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文方向向量,用于表征语序,并利用该模型与主题模型训练主题词向量;其次,分别计算实体上下文相似度、基于实体上下文主题的类别主题相似度以及基于主题词向量的实体主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,相比于现有的主流消歧方法,新方法是有效的。
关键词: 上下文词向量;实体消歧;知识库;主题词向量;主题模型
DOI:
基金资助:
文章地址: