PDF下载
融合单语语言模型的藏汉机器翻译方法研究

慈祯嘉措1,2 桑杰端珠1,2 孙茂松3 色差甲1,2 周毛先1,2

1.青海师范大学藏文信息处理教育部重点实验室;2.青海省藏文信息处理与机器翻译重点实验室;3.清华大学计算机系

摘要: 由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。
关键词: 藏语;语言模型;机器翻译;融合;神经网络
DOI:
基金资助:
文章地址: