检 索
学术期刊
切换导航
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
我要投稿
查看投稿进度
学术期刊
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
在线客服
客服电话:
400-188-5008
客服邮箱:
service@ccnpub.com
投诉举报:
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享
请选择
目标期刊
首页
期刊
文章
神经机器翻译中数据泛化与短语生成方法研究
下载:
43
浏览:
389
李强1
韩雅倩1
肖桐1,2
朱靖波1,2
《中文研究》
2018年3期
摘要:
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。
[1/1]
|<
<
1
>
>|
在线客服::
点击联系客服
联系电话::
400-188-5008
客服邮箱::
service@ccnpub.com
投诉举报::
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享