请选择 目标期刊

Transformer-CRF词切分方法在蒙汉机器翻译中的应用 下载:18 浏览:173

苏依拉 张振仁 庆道尔吉 牛向华 高芬 赵亚平 《中文研究》 2019年6期

摘要:
基于编码—解码(端到端)结构的机器翻译逐渐成为自然语言处理之机器翻译的主流方法,其翻译质量较高且流畅度较好,但依然存在词汇受限、上下文语义信息丢失严重等问题。该文首先进行语料预处理,给出一种Transformer-CRF算法来进行蒙古语词素和汉语分词的预处理方法。然后构建了基于Tensor2Tensor的编码—解码模型,为了从蒙古语语料中学习更多的语法和语义知识,该文给出了一种基于词素四元组编码的词向量作为编码器输入,解码阶段。为了进一步缓解神经网络训练时出现的词汇受限问题,该文将专有名词词典引入翻译模型来进一步提高翻译质量和译文忠实度。根据构建模型对不同长度句子进行实验对比,表明模型在处理长时依赖问题上翻译性能得到提高。

基于TDNN-FSMN的蒙古语语音识别技术研究 下载:38 浏览:352

王勇 和飞龙 高光来 《中文研究》 2018年6期

摘要:
为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈型序列记忆网络"记忆"模块中历史信息和未来信息长度对模型的影响;最后分析了融合的网络结构中隐藏层个数及隐藏层节点数对声学模型性能的影响。实验结果表明,时延神经网络融合前馈型序列记忆网络相比深度神经网络、时延神经网络和前馈型序列记忆网络具有更好的性能,单词错误率与基线深度神经网络模型相比降低22.2%。

蒙古语长音频语音文本自动对齐的研究 下载:50 浏览:398

牛米佳 飞龙 高光来 《当代中文学刊》 2020年2期

摘要:
目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,使用基于高斯混合模型的语音端点检测技术筛选并删除噪音段;在语音识别阶段,构建基于前向型序列记忆网络的蒙古语声学模型;最后基于向量空间模型,将语音识别得到的假设序列和参考音素序列进行句子级别的动态时间归整算法匹配。实验结果表明,与基于Needleman-Wunsch算法的语音对齐比较,该文提出的蒙古语长音频语音文本自动对齐方法的对齐正确率提升了31.09%。

蒙古语言文字翻译与使用的行政法保护 下载:123 浏览:1792

乌仁 《争议解决研究》 2022年4期

摘要:
近年来,蒙古族网友在蒙古族聚居的民族自治地区的街区牌匾上上传一些蒙古文字错译的图片,引发了社会的广泛关注。本文将从块状匾额的错误翻译和错误安装出发,深入探讨蒙古语翻译和使用的行政立法现状,以期提出有效的解决方案,促进蒙古族文化的发展。经过系统的分析,发现蒙古语翻译和使用过程中存在一些问题。通过对相关图片、文献资料和实地调研,得出了这些问题的根源。最终,本文提出了一些具体的解决方案。

浅析艺术专业基础教育的创新途径 下载:261 浏览:2240

李明 车力木格 《中国艺术研究》 2023年12期

摘要:
随着教育制度的不断改革,社会上对于学生的综合素质提出了更高的要求。各所高校为社会上输送了一批又一批的人才,其中艺术专业的人才受到社会各界的广泛关注。目前各所高校艺术专业的基础教育都比较落后,因此高校要不断的对基础教育进行创新,培养学生的创新思维,使学生能够更好的进行艺术创作。本文分析了目前基础教育存在的问题,并提出了创新方法,以供各所高校参考。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享