检 索
学术期刊
切换导航
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
我要投稿
查看投稿进度
学术期刊
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
在线客服
客服电话:
400-188-5008
客服邮箱:
service@ccnpub.com
投诉举报:
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享
请选择
目标期刊
首页
期刊
文章
基于平行语料和翻译概率的多语种词对齐方法
下载:
65
浏览:
207
杨飞扬
赵亚慧
崔荣一
易志伟
《中文研究》
2019年12期
摘要:
为了实现多语种词对齐,该文提出一种以点互信息为基础的翻译概率作为改进的多语种单词关联强度度量方法。首先,论证了在服从Zipf定律的普通频级词区域,单词间关联强度的点互信息度量法可简化为翻译概率;其次,对汉语、英语、朝鲜语平行语料进行句子对齐、分词和去停用词等预处理后计算平行语料单词之间的翻译概率,取翻译概率最高的前k个词作为候选翻译词,并通过优化处理提高了词对齐准确率。实验结果表明,该方法可以不完全依赖语料规模,在小规模语料中取得94%以上的准确率,为跨语言小众文献及低资源语言词对齐提供了技术基础。
[1/1]
|<
<
1
>
>|
在线客服::
点击联系客服
联系电话::
400-188-5008
客服邮箱::
service@ccnpub.com
投诉举报::
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享