PDF下载
D-Reader:一种以全文预测的阅读理解模型

赖郁婷1 曾俋颖1 林柏诚2 萧瑞辰2 邵志杰1

1.台达电子股份有限公司台达研究院;2.台达电子股份有限公司知识管理部

摘要: 该文针对2018机器阅读理解技术竞赛提出一个基于双向注意流(BiDAF)BiDAF的阅读理解模型,实作于DuReader中文问答数据集。该文观察到基线系统采用与问题最相近的段落,作为预测的筛选条件,而改以完整段落来预测答案,结果证实优于原方法。并利用fastText训练词向量以强化上下文信息,最后通过集成学习优化结果,提升效能与稳定性。此外,针对DuReader的是非类题型,该文集成两个分类模型,分别基于注意力机制(attention)与相似性机制(similarity)来预测答案类别。该模型最终在"2018机器阅读理解技术竞赛"的评比中得到了ROUGE-L 56.57与BLEU-4 48.03。
关键词: 机器阅读理解;DuReader;双向注意流;集成学习
DOI:
基金资助:
文章地址: