请选择 目标期刊

基于描述约束的词表示学习 下载:78 浏览:501

冶忠林1,2,3 赵海兴1,4,2,3 张科4,2,3 朱宇4,2,3 《当代中文学刊》 2019年12期

摘要:
词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。

基于文献链接信息分析的科技资源风险评估 下载:31 浏览:288

罗准辰1 赵赫2 叶宇铭1 刘晓鹏1 《当代中文学刊》 2020年8期

摘要:
文献中的链接将文献与数据、代码、文档、网页等科技资源相关联,资源链接引用的上下文信息反映了科研活动中科研主体与科技资源形成的关系。该文通过对文献中的链接信息进行细粒度分析,提出了一种对其关联的科技资源种类和引用目的进行知识建模的方法,并在大规模文献数据集上进行了实证。同时从国内外科技资源的利用情况出发,对科技资源的重要程度、发展方向、使用风险等进行了深入的探索。该文可为了解国内外前沿技术进展,以及我国科研活动中科技资源风险评估判定提供科学依据,且对于自然语言处理领域中对科技文献文本的分析研究具有重大意义。

基于门控联合池化自编码器的通用性文本表征 下载:33 浏览:493

张明华1 吴云芳1 李伟康1 张仰森2 《当代中文学刊》 2019年9期

摘要:
为了学习文本的语义表征,以往的研究者主要依赖于复杂的循环神经网络(recurrent neural networks,RNNs)和监督式学习方法。该文提出了一种门控联合池化自编码器(gated mean-max AAE)用于学习中英文的文本语义表征。该文的自编码器完全通过多头自注意力机制(multi-head self-attention mechanism)来构建编码器和解码器网络。在编码阶段,提出了均值—最大化(mean-max)联合表征策略,即同时运用平均池化(mean pooling)和最大池化(max pooling)操作来捕获输入文本中多样性的语义信息。为促使联合池化表征可以全面地指导重构过程,解码器采用门控操作进行动态关注。通过在大规模中英文未标注语料上训练模型,获得了高质量的句子编码器。在重构文本段落的实验中,该文模型在实验效果和计算效率上均超越了传统的RNNs模型。将公开训练好的文本编码器,使其可以方便地运用于后续的研究。

基于词性约束的藏文分词策略与算法 下载:28 浏览:341

才让卓玛1 才智杰2 《当代中文学刊》 2020年5期

摘要:
自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现状,提出基于词性约束的藏文分词策略与算法。相对于传统方法,该方法不仅能有效地预防和处理各类歧义现象,而且在藏文未登录词处理方面有较好表现。

ResNet结合BiGRU的关系抽取混合模型 下载:34 浏览:329

唐朝1 诺明花1 胡岩2 《当代中文学刊》 2020年4期

摘要:
关系抽取主要目的是将非结构化或半结构化描述的自然语言文本转化成结构化数据,其主要负责从文本中识别出实体,抽取实体间的语义关系。就关系抽取任务而言,当前流行的网络结构是仅使用CNN作为编码器,经过多层卷积操作后,对池化的结果进行softmax分类。还有部分工作则使用RNN并结合Attention机制对最后的结果做分类。这些网络结构在远程监督带噪声的关系抽取任务中表现并不理想。该文主要根据ResNet残差块的特性,提出了一种混合模型,它有效融合,ResNet和BiGRU,将带有残差特性的CNN和双向RNN结合起来,最后融入注意力机制来完成基于远程监督的关系抽取任务。实验验证了该混合模型在远程监督的噪声过滤方面的有效性。在NYT-Freebase数据集上,P@N值相比使用单一ResNet提高了2.9%。另外,该文所建混合模型可以很轻易地移植应用到其他NLP任务中。

基于带注意力机制CNN的联合知识表示模型 下载:34 浏览:254

彭敏 姚亚兰 谢倩倩 高望 《当代中文学刊》 2019年6期

摘要:
知识表示学习在自然语言处理领域获得了广泛关注,尤其在实体链指、关系抽取及自动问答等任务上表现优异。然而,大部分已有的表示学习模型仅利用知识库中的结构信息,无法很好地处理新的实体或关联事实极少的实体。为解决该问题,该文提出了引入实体描述信息的联合知识表示模型。该模型先利用卷积神经网络编码实体描述,然后利用注意力机制来选择文本中的有效信息,接着又引入位置向量作为补充信息,最后利用门机制联合结构和文本的向量,形成最终的联合表示。实验表明,该文的模型在链路预测和三元组分类任务上与目前最好的模型性能相近。

基于PCFG的藏文疑问句句法分析 下载:43 浏览:371

班玛宝1,2,3 才智杰1,2,3 拉玛扎西1,2,3 《当代中文学刊》 2019年5期

摘要:
藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3%和97.4%,在开放测试集上的准确率、召回率和F1值分别达96.0%、95.4%和95.7%。

基于神经网络的藏语语音合成 下载:71 浏览:427

都格草才让卓玛 南措吉算太本 《当代中文学刊》 2019年5期

摘要:
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。

中小学生校园阅读推进的主要问题与对策研究——以广州市越秀区小学为例 下载:44 浏览:237

高瑞翔 1胡景悦2 杨洁3 范尹晴1 莫雷1 《心理学研究》 2019年5期

摘要:
全民阅读是党和国家高度重视的发展战略,校园阅读是其中的重点,然而,目前我国校园阅读的开展并不理想。通过在广州市中小学进行大规模阅读状况调研发现,校园阅读工作开展一直面临"难知、难导、难管"的瓶颈,实际成效不佳。对此,该研究提出了通过构建"互联网+中小学生成长阅读平台"推进校园阅读的创新举措,并在广州市越秀区20多所小学实施试点实验;历时半年,成效显著,学生在阅读的重视程度、投入时间、阅读课外图书的意义性与均衡性、阅读的方式方法及家校支持等方面均有明显提升。据此,提出推进校园阅读的三点建议:应做好顶层设计和建立系统管理与评价机制,应形成家校合作的支持网络,应推广共建学生校园阅读综合信息平台。

蒙古语长音频语音文本自动对齐的研究 下载:50 浏览:408

牛米佳 飞龙 高光来 《当代中文学刊》 2020年2期

摘要:
目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,使用基于高斯混合模型的语音端点检测技术筛选并删除噪音段;在语音识别阶段,构建基于前向型序列记忆网络的蒙古语声学模型;最后基于向量空间模型,将语音识别得到的假设序列和参考音素序列进行句子级别的动态时间归整算法匹配。实验结果表明,与基于Needleman-Wunsch算法的语音对齐比较,该文提出的蒙古语长音频语音文本自动对齐方法的对齐正确率提升了31.09%。

基于胶囊网络的药物相互作用关系抽取方法 下载:45 浏览:422

刘宁宁1 琚生根1 熊熙2 王婧妍1 张芮1 《当代中文学刊》 2020年1期

摘要:
药物相互作用是指药物之间存在的抑制或促进等作用。针对目前药物关系抽取模型在长语句中抽取效果较差以及高层特征信息丢失的问题,该文提出了一种结合最短依存路径的胶囊网络关系抽取模型,该方法首先根据原语句解析出两个药物之间的最短依存路径,然后利用双向长短期记忆网络分别获取原语句和最短依存路径的低层语义表示,再将两者结合输入到胶囊网络中,利用胶囊网络的动态路由机制,动态地决定低层胶囊向高层胶囊传送的信息量,避免了高层特征信息丢失的问题,从而提升抽取效果。在DDIExtraction 2013药物相互作用关系抽取任务上的实验结果表明,该文方法的F1值优于目前最优方法1.17%。

子字粒度切分在蒙汉神经机器翻译中的应用 下载:25 浏览:386

任众 侯宏旭 吉亚图 武子玉 白天罡 雷颖 《当代中文学刊》 2019年2期

摘要:
在蒙汉神经机器翻译任务中,由于语料稀少使得数据稀疏问题严重,极大影响了模型的翻译效果。该文对子字粒度切分技术在蒙汉神经机器翻译模型中的应用进行了研究。通过BPE算法将切分粒度控制在字符和词之间的子字粒度大小,将低频词切分成相对高频的子字片段,来缓解数据稀疏问题,从而在有限的数据和硬件资源条件下,更高效地提升模型的鲁棒性。实验表明,在两种网络模型中使用子字粒度切分技术,BLEU值分别提升了4.81和2.96,且随着语料的扩大,训练周期缩短效果也更加显著,说明子字粒度切分技术有助于提高蒙汉神经机器翻译效果。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:36 浏览:294

陈世梅1 伍星1 唐凡2 《当代中文学刊》 2018年12期

摘要:
否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征对覆盖域进行识别。中文否定与不确定信息语料上,触发词识别取得F1值为91.03%,覆盖域识别在该语料的子语料财经新闻上取得F1值最高为73.91%。实验结果表明,这一模型在汉语否定触发词识别和覆盖域识别上取得的效果优于CRF模型和BiLSTM模型。

ACMF:基于卷积注意力模型的评分预测研究 下载:66 浏览:298

商齐1 曾碧卿1,2 王盛玉1 周才东1 曾锋1 《当代中文学刊》 2018年11期

摘要:
评分数据稀疏是影响评分预测的主要因素之一。为了解决数据稀疏问题,一些推荐模型利用辅助信息改善评分预测的准确率。然而大多数推荐模型缺乏对辅助信息的深入理解,因此还有很大的提升空间。鉴于卷积神经网络在特征提取方面和注意力机制在特征选择方面的突出表现,该文提出一种融合卷积注意力神经网络(Attention Convolutional Neural Network,ACNN)的概率矩阵分解模型:基于卷积注意力的矩阵分解(Attention Convolutional Model based Matrix Factorization,ACMF),该模型首先使用词嵌入将高维、稀疏的词向量压缩成低维、稠密的特征向量;接着,通过局部注意力层和卷积层学习评论文档的特征;然后,利用用户和物品的潜在模型生成评分预测矩阵;最后计算评分矩阵的均方根误差。在ML-100k、ML-1m、ML-10m、Amazon数据集上的实验结果表明,与当前取得最好预测准确率的PHD模型相比,ACMF模型在预测准确率上分别提高了3.57%、1.25%、0.37%和0.16%。

基于天线选择的MIMO系统能效功率分配优化 下载:58 浏览:373

张永棠 《信息通信与技术》 2020年3期

摘要:
对MIMO系统在毫米波衰落信道下的能效功率分配进行研究,以期实现绿色传输。考虑发送端采用天线选择技术,接收端采用最大比合并技术,给出系统能量效率公式,并构建系统基于能效最大化的目标优化函数。利用拉格朗日乘子法,获得迭代功率分配方案。利用排序法及朗伯函数给出简单的闭式功率分配方案。利用Matlab软件验证所提功率分配方案的有效性。仿真结果表明,文章提出的功率分配方案较穷举搜索法EE性能得到了明显提升,是一种复杂度低的优化算法,能快速收敛到EE最大值。

区块链交易数据隐私保护机制 下载:76 浏览:394

祝烈煌 董慧 沈蒙 《数据与科学》 2018年12期

摘要:
区块链技术是一种去中心化、去信任化、公开透明的分布式数据存储技术,能够降低信任成本,实现安全可靠的数据交互。然而,攻击者可以轻易地从公开的全局账本中获得所有数据,并通过大数据分析技术挖掘用户交易规律等隐私信息。分析区块链交易数据面临的隐私泄露威胁,描述基于数据分析的攻击方法;介绍以混币机制为代表的交易数据隐私保护机制,简要描述各种混币方法的基本原理,并针对混币过程是否需要中心节点参与的问题分析不同混币机制的优势与缺陷;最后,分析了现有区块链数据隐私保护技术中存在的不足,并展望未来的发展方向。

基于电子作业挖掘的学生学习预警模型研究 下载:57 浏览:482

张笑非 段先华 刘镇 钱萍 《软件工程研究》 2019年9期

摘要:
混合式教学的普及使得电子作业成为一种评价学生学习效果的重要数据来源,利用机器学习对电子作业进行建模是对学生学习预警的一种有益探索。本文在对电子作业进行分词和向量化基础上,通过k-means聚类和轮廓系数来判断其语义的多样性,通过计算文档向量相似性矩阵的网络效率来评价电子作业的中心性。实验结果显示,该方法可以有效寻找电子作业聚类效果最优时的簇类多样性,也可以有效评价电子作业相似度的网络中心性。因此,该方法作为一种学生学习预警模型,可以对电子作业文档的多样性和中心性给出客观的总体评价。

基于Android的智能无线鼠标的设计与实现 下载:63 浏览:492

邓丽平1 杨丽凤2 《软件工程研究》 2019年2期

摘要:
随着信息技术的发展和教学改革的推进,高校广泛开展了以计算机为辅助手段的多媒体教学。多媒体教学有其突出的优越性,但也有着很多弊端。本文针对多媒体在教学应用中的不足,提出了智能无线鼠标软件。该软件利用Android智能手机、Wi-Fi无线网络和应用程序实现了无线鼠标和激光笔两方面功能,有助于在课堂上拉近师生间距离、提高教学互动性,从而真正让多媒体在现代教育中发挥出应有的作用。本系统在实验测试和实际应用中有良好的应用效果。

物联网视频感知节点的动态同步建模与仿真 下载:72 浏览:477

刘晓霞1 李芳2 《软件工程研究》 2019年2期

摘要:
针对物联网视频感知的动态同步问题,本文用π网理论建立了物联网视频感知的抽象模型DSAM,以描述其动态同步问题。首先建立基于π网的物联网视频感知抽象模型DSAM,然后对模型进行了状态演变、模型变迁和动态交互等分析,最后利用模型DSAM对实例进行分析和仿真。通过对模型DSAM的仿真和分析可知,该模型能够正确处理物联网视频感知的动态同步并发性,具有一定的实用价值。

大数据视野下高校创新分析系统开发与设计 下载:76 浏览:475

王彤宇 《软件工程研究》 2019年1期

摘要:
当前各类高校的创新创业教育呈燎原之势,此教育改革产生海量的教师教学创新、学生创新活动等数据,以及频繁档案更新任务,需要有高效数据存储与处理能力的系统与之相匹配。本文重点探讨以大数据技术为核心的高校创新分析系统开发设计理念,提出了解决信息处理速度和系统评价机制的软件设计方向,并运用Succinct、Spark、Mesos、SQL和Operator等技术实现设计,还给出了海量异构数据存储硬件资源方案,为专业教育与创新创业教育融合质量评价、人才培养模式创新评价构建了高效分析环境。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享