PDF下载
基于多编码器多解码器的大规模维汉神经网络机器翻译模型

张金超1,2,3 艾山·吾买尔4 买合木提·买买提4 刘群1,5

1.中国科学院计算技术研究所智能信息处理重点实验室;2.中国科学院大学;3.腾讯科技(北京)有限公司;4.新疆大学信息科学与工程学院;5.都柏林城市大学

摘要: 为提升维汉机器翻译模型的翻译能力,该文提出使用多编码器多解码器的结构,搭建大规模的维汉神经网络机器翻译模型。相比于单编码器单解码器的浅层的小模型,多编码器多解码器模型具有多个编码器,可以对源语言进行多层次、多视角的压缩表示;同时具有多个解码器,可以增强目标语言的生成能力。实验证明,在大规模的训练数据上,使用该方法搭建的大规模维汉神经网络机器翻译模型,译文质量可以大幅度地超过基于短语的统计机器翻译模型和基本的神经网络翻译模型。该文还针对维汉翻译源端语言和目标端语言的翻译单元粒度进行了实验,发现维吾尔语端使用字节对编码单元、汉语端使用字单元,可以消除对汉语分词器的依赖,做到和双端都使用字节对编码单元可比的效果。
关键词: 维汉机器翻译;神经网络;多编码器多解码器
DOI:
基金资助:
文章地址: