请选择 目标期刊

基于神经网络的藏文正字检错法 下载:32 浏览:286

色差甲1 慈祯嘉措1 才让加1,2 华果才让1 《中文研究》 2020年9期

摘要:
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。

基于迭代式回译策略的藏汉机器翻译方法研究 下载:52 浏览:251

慈祯嘉措1,2 桑杰端珠1,2 孙茂松3 周毛先1,2 色差甲1,2 《中文研究》 2020年6期

摘要:
该文通过稀缺语言资源条件下机器翻译方法的研究以提高藏汉机器翻译质量,同时希望对语言资源匮乏的其他少数民族语言机器翻译研究提供借鉴。首先该文使用164.1万句对藏汉平行语言资源数据在Transformer神经网络翻译模型上训练一个基线系统,作为起始数据资源,然后结合翻译等效性分类器,利用迭代式回译策略和译文自动筛选机制,实现了稀缺资源条件下提升藏汉神经网络机器翻译性能的有效模型,使最终的模型比基准模型在藏到汉的翻译上有6.7个BLEU值的提升,在汉到藏的翻译上有9.8个BLEU值的提升,证实了迭代式回译策略和平行句对过滤机制在汉藏(藏汉)机器翻译中的有效性。

融合单语语言模型的藏汉机器翻译方法研究 下载:60 浏览:256

慈祯嘉措1,2 桑杰端珠1,2 孙茂松3 色差甲1,2 周毛先1,2 《中文研究》 2019年11期

摘要:
由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。

基于循环卷积神经网络的藏文句类识别 下载:27 浏览:264

柔特1,2 才让加1,2 《中文研究》 2019年11期

摘要:
句子是语言的最小使用单位,句类识别是为了进一步细化句法和句义研究。由于藏文句尾通常没有特殊的标点符号来识别不同句类,因此这一藏文语言特性就变成了一大难题。该文提出了基于语境和功能特征为一体的句子用途分类方案。首先,该文介绍了文法中藏文句子分类及其特征。其次,收集了大量藏文句子并对其进行了人工标注。最后,采用循环卷积神经网络对藏文句类进行了自动识别。实验表明,该模型对藏文句类识别有较为显著的效果。

基于多源信息融合的分布式词表示学习 下载:25 浏览:444

冶忠林1,2,3,4 赵海兴1,2,3,4 张科1,3,4 朱宇1,3,4 《中文研究》 2019年6期

摘要:
分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足:(1)罕见词由于缺乏充分上下文训练数据,训练所得的罕见词向量表示不能充分地反映其在语料中的语义信息;(2)中心词语的反义词出现于上下文时,会使意义完全相反的词却赋予更近的空间向量表示;(3)互为同义词的词语均未出现于对方的上下文中,致使该类同义词学习得到的表示在向量空间中距离较远。基于以上三点,该文提出了一种基于多源信息融合的分布式词表示学习算法(MSWE),主要做了4个方面的改进:(1)通过显式地构建词语的上下文特征矩阵,保留了罕见词及其上下文词语在语言训练模型中的共现信息可以较准确地反映出词语结构所投影出的结构语义关联;(2)通过词语的描述或解释文本,构建词语的属性语义特征矩阵,可有效地弥补因为上下文结构特征稀疏而导致的训练不充分;(3)通过使用同义词与反义词信息,构建了词语的同义词与反义词特征矩阵,使得同义词在词向量空间中具有较近的空间距离,而反义词则在词向量空间中具有较远的空间距离;(4)通过诱导矩阵补全算法融合多源特征矩阵,训练得到词语低维度的表示向量。实验结果表明,该文提出的MSWE算法能够有效地从多源词语特征矩阵中学习到有效的特征因子,在6个词语相似度评测数据集上表现出了优异的性能。

藏文字同现网络的小世界效应和无标度特性 下载:19 浏览:204

才智杰1 孙茂松2 才让卓玛1 《中文研究》 2018年9期

摘要:
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。

典型吸附模型的非线性和线性拟合对比分析 下载:53 浏览:454

拦继元 卫旭琴 杨林 《中国环境保护》 2019年6期

摘要:
为了验证各种典型吸附模型在非线性拟合和线性拟合的条件下,拟合结果是否相同这一问题,文章以沙粒对氨氮的吸附试验为例,对Langmuir和Freundlish吸附等温线模型以及准一级和准二级吸附动力学模型和附热力学Van’t Hoff模型进行了相同试验数据条件下的非线性拟合和线性拟合。结果表明,两种吸附等温线模型和准一级动力学模型的线性拟合相关系数小于对应的非线性拟合相关系数,并且两种拟合所得参数的差距也较大;但是,在准二级吸附动力学模型和Van’t Hoff模型中,情况又有所不同,表现出来线性拟合的相关系数大于等于非线性拟合的相关系数,并且两种拟合所得参数的相对误差小于1%,因此,可将其作为判定线性拟合结果是否合理的一个参考依据。综上所述,吸附模型的拟合应尽量采用非线性拟合,如若采用线性拟合,则有可能会带来较大的误差,从而影响吸附模型的精度。

一种基于TCLSTM的藏文词拼写检查方法 下载:39 浏览:301

华旦扎西1 才智杰2 班玛宝3 《当代中文学刊》 2020年8期

摘要:
拼写检查能够快速检测文本错误,提高文本校对效率,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。该文在分析藏文拼写检查技术和语言模型的基础上,以藏文词拼写检查为目标,选用具有长远距离记忆功能的LSTM建立TCLSTM语言模型,设计基于TCLSTM的藏文词拼写检查算法。经测试,基于TCLSTM语言模型的藏文词拼写检查取得了较好的效果。

基于描述约束的词表示学习 下载:78 浏览:495

冶忠林1,2,3 赵海兴1,4,2,3 张科4,2,3 朱宇4,2,3 《当代中文学刊》 2019年12期

摘要:
词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。

注意力的端到端模型生成藏文律诗 下载:47 浏览:420

色差甲1,2 华果才让1,2 让加1,2 慈祯嘉措1,2 柔特1,2 《当代中文学刊》 2019年12期

摘要:
文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文律诗生成结果中BLEU值和ROUGE值分别能达到59.27%、62.34%,并无需任何人为的特征设置。

基于词性约束的藏文分词策略与算法 下载:28 浏览:334

才让卓玛1 才智杰2 《当代中文学刊》 2020年5期

摘要:
自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现状,提出基于词性约束的藏文分词策略与算法。相对于传统方法,该方法不仅能有效地预防和处理各类歧义现象,而且在藏文未登录词处理方面有较好表现。

基于PCFG的藏文疑问句句法分析 下载:43 浏览:366

班玛宝1,2,3 才智杰1,2,3 拉玛扎西1,2,3 《当代中文学刊》 2019年5期

摘要:
藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3%和97.4%,在开放测试集上的准确率、召回率和F1值分别达96.0%、95.4%和95.7%。

基于神经网络的藏语语音合成 下载:71 浏览:421

都格草才让卓玛 南措吉算太本 《当代中文学刊》 2019年5期

摘要:
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。

藏文音节拼写检查的CNN模型 下载:24 浏览:268

色差甲1,2 贡保才让1,2 才让加1,2 《当代中文学刊》 2019年1期

摘要:
藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。

基于SPSS软件对调查问卷进行频率分析的研究 下载:59 浏览:368

赵晓娜 《电子商务进展》 2018年9期

摘要:
使用spss23.0对调查问卷进行数据分析的研究包括变量的定义、数据的录入和数据的分析的步骤和具体操作方法进行了比较详细的分析。

青海省表层土壤属性数字制图 下载:50 浏览:411

庞龙辉1,2 刘峰2 赵霞1 宋效东2 李德成2 张甘霖2,3 石平超1,4 王欣烨1 代子俊1 《土壤研究》 2019年7期

摘要:
对于土壤景观复杂的大区域,样点往往较为稀疏,如何准确地进行土壤预测制图仍是一个需要研究的问题。本文以青海省为研究区,基于近年采集205个土系调查点数据,采用随机森林模型,分别建立了表层(0~20 cm)土壤全氮、有机碳、粉粒含量和pH四个基本土壤属性与环境协同变量(海拔、坡度、地形湿度指数、年降水量、年平均气温、归一化植被指数、地表温度和地表反射率)之间的定量关系模型,对该地区进行了土壤多要素预测制图,分析了影响土壤空间变异的控制性因素。交叉验证结果显示,全氮、有机碳、粉粒含量和pH的R2分别是0.61、0.53、0.47和0.54,这说明随机森林模型可解释47%以上的土壤空间变异。表层土壤全氮和有机碳空间分布趋势东南高,西北低,pH呈现出相反的空间模式;粉粒含量东高西低,预测结果高值出现在柴达木盆地和南部玉树、果洛地区。环境变量的重要性分析表明,年降水量对表层土壤全氮、有机碳、pH空间分布模式具有控制性影响,夜间地表温度与表层土壤粉粒含量空间变异具有较强的协同关系。

国内金融地理学研究进展述评 下载:38 浏览:361

赵晓娜 《金融研究杂志》 2019年2期

摘要:
2001年,劳拉詹南的《金融地理学》中文版刊出,开启了中国金融地理学研究的序幕,中国特殊的经济地理条件,为金融地理学研究提供很好的研究平台。文章梳理知网和硕博论文库里近15年国内金融地理学相关文献,对国内金融地理学研究的进展进行系统述评。研究发现,国内学者的研究重心主要集中在金融地理视角下的区域金融研究、区域经济、金融中心和金融排斥等几个方面。根据对文献进行述评的结果,在未来金融地理学的研究中,应该重视对微观经济主体的研究,应该结合国家战略进行研究,应该重视不同学科的理论交叉和研究方法交叉,这要求学者们具有更深的学术素养和更广阔的学术视野来兼顾宏观研究与微观研究、由对研究对象的表层分析到本质探求、由单一的静态分析和动态分析转变到静态分析和动态分析相结合。

砂石过滤河水中氨氮的吸附机制分析 下载:46 浏览:385

卫旭琴 雷菲 王琼瑶 拦继元 杨林 《可持续发展与创新》 2018年1期

摘要:
为了研究砂石过滤吸附水中有机物的规律和性能,以西宁市湟水河水为研究对象,研究其对水溶液中氨氮的等温吸附特性,利用一级动力学模型、二级动力学模型对砂石吸附氨氮动力学过程进行了分析。

浅析翻转课堂模式在“氧气制取”实验教学中的应用 下载:50 浏览:447

朱小玲 斗果 《教学管理研究》 2020年6期

摘要:
翻转课堂教学模式颠倒了传统教学中知识传授与知识内化的次序,体现了以学生为中心,是一种新型教学模式,有助于改变传统的教学方式,培养学生自主学习的能力,激发学生的学习兴趣和求知欲。文章以氧气的制取为例,将翻转课堂教学模式运用到中学化学教学中,根据翻转课堂教学模式的关键环节,从课前微视频的制作或收集、学生课前的自主学习、课中的内化吸收及课后的深化等各环节来设计教学。采用翻转课堂实验教学,能很好地培养学生的自主学习能力,同时也解决了我国经济发展不均衡和学习资源环境的不全面、师资力量不足等问题。

试论统编本一年级语文教材的知识选择 下载:47 浏览:413

李英英 《国际教育论坛》 2020年4期

摘要:
统编本一年级语文教材的知识选择内涵丰富,特征鲜明,具有国家性、全面性、衔接性、建构性。较"一纲多本"下的教材,统编本语文教材有些许新变化,一是完善了知识类型,表现为增设中国和中华民族风格知识、国家和民族基本价值观知识,减少识字、写字量,增加阅读量,有利于树立学生的价值导向,建构学科素养,达到"浇花浇根,育人育心"的效果;二是重构了内容结构,表现为调整汉语拼音、识字顺序,增设"快乐读书吧""和大人一起读"栏目,有利于降低幼小衔接坡度,促进家校共育,实现学科育人。同时,教材的统编统用给家庭及学校带来新的育人机遇与挑战,这需要两个场域重审关系网络,建立与新教材使用相适应的型构。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享