PDF下载
基于多篇章多答案的阅读理解系统

刘家骅1,2 韦琬2 陈灏2 杜彦涛2

1.清华大学计算机系;2.北京奇点机智科技有限公司

摘要: 机器阅读理解任务一直是自然语言处理领域的重要问题。2018机器阅读理解技术竞赛提供了一个基于真实场景的大规模中文阅读理解数据集,对中文阅读理解系统提出了很大的挑战。为了应对这些挑战,我们在数据预处理、特征表示、模型选择、损失函数的设定和训练目标的选择等方面基于以往的工作做出了对应的设计和改进,构建出一个最先进的中文阅读理解系统。我们的系统在正式测试集ROUGE-L和BLEU-4上分别达到了63.38和59.23,在105支提交最终结果的队伍里面取得了第一名。
关键词: 机器阅读理解;问答系统;深度循环神经网络
DOI:
基金资助:
文章地址: