PDF下载
基于Bi-GRU并包含注意力机制的文本数据真值发现

常宸1 曹建军2 吕国俊1 郑奇斌1 翁年凤2

1.陆军工程大学指挥控制工程学院;2.国防科技大学第六十三研究所

摘要: 针对传统真值发现算法无法直接应用于文本数据的问题,该文提出基于Bi-GRU并包含注意力机制的文本数据真值发现方法。根据文本答案的多因素性,词语使用的多样性与文本数据的稀疏性等特点,该文对用户答案进行细粒度划分,并利用Bi-GRU表征文本答案的语义信息,利用双层注意力机制分别学习用户答案关键词可靠度及用户答案可靠度。依据真值发现的一般假设,无监督学习上下文向量,并最终获得可靠答案。实验结果表明,该算法适用于文本数据真值发现场景,较基于检索的方法及传统真值发现算法效果更优。
关键词: 数据质量;真值发现;神经网络;文本挖掘
DOI:
基金资助:
文章地址: