请选择 目标期刊

基于视觉的室内四旋翼无人机目标追踪系统设计 下载:51 浏览:367

龚子然1 代勇1 王响2 王玉花1 《中国仪器》 2018年5期

摘要:
针对无人机在室内飞行无法依靠GPS定位飞行,还有一些人员无法到达的地点进行关键信息的搜寻工作问题,设计了一种基于视觉的室内四旋翼无人机目标追踪系统,实现室内定位自主飞行与物体自主识别跟踪功能。

基于粗糙集和多通道词向量的中文文本情感特征分析 下载:42 浏览:378

陈波1 谢珺1 苗夺谦2 王雨竹1 续欣莹3 《中文研究》 2020年10期

摘要:
粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法。利用粗糙集决策表对整个语料库进行情感词特征建模,采用Johnson粗糙集属性约简算法对决策表进行化简,保留最小的文本情感词特征属性集,之后再对该集合中的所有情感特征词进行词嵌入表示,最后用逻辑回归分类器验证RS-WvGv方法的有效性。另外,该文还定义了情感词特征属性集覆盖力,用于表示文本情感词特征属性集合对语料库的覆盖能力。最后,在实验对比的过程中,用统计检验进一步验证了该方法的有效性。

基于神经网络的藏文正字检错法 下载:32 浏览:293

色差甲1 慈祯嘉措1 才让加1,2 华果才让1 《中文研究》 2020年9期

摘要:
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。

基于原型网络的细粒度实体分类方法 下载:48 浏览:363

任权 《中文研究》 2020年8期

摘要:
细粒度实体分类任务作为命名实体识别任务的扩展,其目的是根据指称及其上下文,发掘实体更细粒度的类别含义。由于细粒度实体语料的标注代价较大,标注错误率较高,因此该文研究了在少量样本情况下的细粒度实体分类方法。该文首先提出了一种特征提取模型,能够分别从单词层面以及字符层面提取实体信息,随后结合原型网络将多标签分类任务转化为单标签分类任务,通过缩小空间中同类样本与原型的距离实现分类。该文使用少样本学习以及零样本学习两种设置在公开数据集FIGER(GOLD)上进行了实验,在少样本学习的设置下,较基线模型在三个指标中均有提升,其中macro-F1的提升最大,为2.4%。

基于循环卷积神经网络的藏文句类识别 下载:27 浏览:271

柔特1,2 才让加1,2 《中文研究》 2019年11期

摘要:
句子是语言的最小使用单位,句类识别是为了进一步细化句法和句义研究。由于藏文句尾通常没有特殊的标点符号来识别不同句类,因此这一藏文语言特性就变成了一大难题。该文提出了基于语境和功能特征为一体的句子用途分类方案。首先,该文介绍了文法中藏文句子分类及其特征。其次,收集了大量藏文句子并对其进行了人工标注。最后,采用循环卷积神经网络对藏文句类进行了自动识别。实验表明,该模型对藏文句类识别有较为显著的效果。

基于多源信息融合的分布式词表示学习 下载:25 浏览:455

冶忠林1,2,3,4 赵海兴1,2,3,4 张科1,3,4 朱宇1,3,4 《中文研究》 2019年6期

摘要:
分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足:(1)罕见词由于缺乏充分上下文训练数据,训练所得的罕见词向量表示不能充分地反映其在语料中的语义信息;(2)中心词语的反义词出现于上下文时,会使意义完全相反的词却赋予更近的空间向量表示;(3)互为同义词的词语均未出现于对方的上下文中,致使该类同义词学习得到的表示在向量空间中距离较远。基于以上三点,该文提出了一种基于多源信息融合的分布式词表示学习算法(MSWE),主要做了4个方面的改进:(1)通过显式地构建词语的上下文特征矩阵,保留了罕见词及其上下文词语在语言训练模型中的共现信息可以较准确地反映出词语结构所投影出的结构语义关联;(2)通过词语的描述或解释文本,构建词语的属性语义特征矩阵,可有效地弥补因为上下文结构特征稀疏而导致的训练不充分;(3)通过使用同义词与反义词信息,构建了词语的同义词与反义词特征矩阵,使得同义词在词向量空间中具有较近的空间距离,而反义词则在词向量空间中具有较远的空间距离;(4)通过诱导矩阵补全算法融合多源特征矩阵,训练得到词语低维度的表示向量。实验结果表明,该文提出的MSWE算法能够有效地从多源词语特征矩阵中学习到有效的特征因子,在6个词语相似度评测数据集上表现出了优异的性能。

机器阅读理解中观点型问题的求解策略研究 下载:79 浏览:361

段利国 高建颖 李爱萍 《中文研究》 2019年5期

摘要:
针对机器阅读理解中观点型问题的求解,提出一个端到端深度学习模型,使用Bi-GRU对文章和问题进行上下文语义编码,然后运用基于拼接、双线性、点乘和差集4种函数的注意力加上Query2Context和Context2Query两个方向注意力的融合算法获取文章和问题的综合语义信息,之后运用多层注意力转移推理机制不断聚焦,进一步获取更加准确的综合语义,最终将其与候选答案进行比较,选出正确答案。该模型在AIchallager2018观点型阅读理解中文测试数据集上准确率达到76.79%,性能超过基线系统。此外,该文尝试文章以句子序列作为输入表示进行答案求解,准确率达到78.48%,获得较好试验效果。

面向机器学习的流式文档逻辑结构标注方法研究 下载:78 浏览:492

刘倩 李宁 田英爱 《中文研究》 2019年2期

摘要:
针对采用机器学习方法识别流式文档结构时语料库稀少、语料标注复杂的问题,该文在研究文档的逻辑结构和编辑语义特征的基础上,确立流式文档逻辑结构标注体系,并提出一种三段式的半自动文档逻辑结构标注方法:第一阶段通过机助人工实现文档元数据的分离式标注,第二阶段自动重建逻辑结构,第三阶段自动填充特征向量。实验结果表明,该文提出的文档逻辑结构标注方法能够节省人工成本、提高机器学习算法对文档结构识别的准确率与召回率,F值达到97.5%。

基于循环实体网络的细粒度情感分析 下载:55 浏览:462

贾川 方睿浦东 康刚 《中文研究》 2019年1期

摘要:
目前,深度神经网络模型已经在文本情感分析领域取得了较好的效果,但是对于属性相关的细粒度的情感分析任务,现有研究方法的效果仍有待改进。该文提出了一种基于循环实体网络来进行细粒度情感分析的方法,在网络中嵌入预定义的评价属性类别信息,利用扩大的内部记忆链来抽取与每个属性类别相关的情感特征,并通过动态记忆单元控制与属性相关情感信息的远距离依赖,然后,对于给定的单个属性类别,利用注意力机制从内部记忆链中抽取该属性类别的情感特征进行分类。该文提出的方法在Sentihood数据上与目前精度最高的方法相比,取得了近1个百分点的提升,而且模型的收敛速度更快。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:17 浏览:208

1.重庆大学计算机学院;2.上海拍拍贷金融信息服务有限公司 《中文研究》 2018年12期

摘要:
否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征对覆盖域进行识别。中文否定与不确定信息语料上,触发词识别取得F1值为91.03%,覆盖域识别在该语料的子语料财经新闻上取得F1值最高为73.91%。实验结果表明,这一模型在汉语否定触发词识别和覆盖域识别上取得的效果优于CRF模型和BiLSTM模型。

ACMF:基于卷积注意力模型的评分预测研究 下载:64 浏览:437

商齐1 曾碧卿1,2 王盛玉1 周才东1 曾锋1 《中文研究》 2018年11期

摘要:
评分数据稀疏是影响评分预测的主要因素之一。为了解决数据稀疏问题,一些推荐模型利用辅助信息改善评分预测的准确率。然而大多数推荐模型缺乏对辅助信息的深入理解,因此还有很大的提升空间。鉴于卷积神经网络在特征提取方面和注意力机制在特征选择方面的突出表现,该文提出一种融合卷积注意力神经网络(Attention Convolutional Neural Network,ACNN)的概率矩阵分解模型:基于卷积注意力的矩阵分解(Attention Convolutional Model based Matrix Factorization,ACMF),该模型首先使用词嵌入将高维、稀疏的词向量压缩成低维、稠密的特征向量;接着,通过局部注意力层和卷积层学习评论文档的特征;然后,利用用户和物品的潜在模型生成评分预测矩阵;最后计算评分矩阵的均方根误差。在ML-100k、ML-1m、ML-10m、Amazon数据集上的实验结果表明,与当前取得最好预测准确率的PHD模型相比,ACMF模型在预测准确率上分别提高了3.57%、1.25%、0.37%和0.16%。

藏文字同现网络的小世界效应和无标度特性 下载:19 浏览:212

才智杰1 孙茂松2 才让卓玛1 《中文研究》 2018年9期

摘要:
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。

基于TDNN-FSMN的蒙古语语音识别技术研究 下载:38 浏览:368

王勇 和飞龙 高光来 《中文研究》 2018年6期

摘要:
为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈型序列记忆网络"记忆"模块中历史信息和未来信息长度对模型的影响;最后分析了融合的网络结构中隐藏层个数及隐藏层节点数对声学模型性能的影响。实验结果表明,时延神经网络融合前馈型序列记忆网络相比深度神经网络、时延神经网络和前馈型序列记忆网络具有更好的性能,单词错误率与基线深度神经网络模型相比降低22.2%。

基于词注意力卷积神经网络模型的情感分析研究 下载:33 浏览:513

王盛玉1 曾碧卿1,2 商齐1 韩旭丽1 《中文研究》 2018年4期

摘要:
情感分类任务需要捕获文本中的情感特征,利用重要的局部特征构建文本的特征表示。卷积神经网络(convolutional neural networks,CNN)已经被证明拥有出色的特征学习能力,但是该模型无法判别输入文本中特征词与情感的相关性,卷积层缺乏对单一词特征的提取。基于目前运用非常成功的注意力模型,该文提出一种基于词注意力的卷积神经网络模型(word attention-based convolutional neural networks,WACNN)。相比于卷积神经网络,该模型以篇章的文本信息作为输入,首先在词嵌入层之后增加注意力机制层,获取重要的局部特征词,使模型有选择地进行特征提取;然后在卷积层中增加大小为1的卷积核,提取单一词的特征;最后该方法对输入文本进行适当的文本填充,保证每个词都存在上下文信息,使模型有效提取到每个词的n-grams局部特征,避免卷积处理过程中局部信息的丢失。该模型在MR5K和CR数据集上进行验证,较普通卷积神经网络和传统机器学习方法,在准确率上分别取得0.5%和2%的提升。

异质信息网络中基于元路径的社团发现算法研究 下载:58 浏览:406

郑玉艳1 王明省2 石川1 王锐1 《中文研究》 2018年4期

摘要:
实际的网络化数据往往包含多种类型的对象和关系,采用异质信息网络可以更好地对其建模,因此异质信息网络分析逐渐成为数据挖掘的研究热点。虽然同质信息网络中的社团发现已经被深入研究,但是异质信息网络中的社团发现还很少被研究。该文研究异质信息网络中的社团发现问题,提出了一个新的社团发现算法框架HCD(heterogeneous community detection)。该框架由两部分组成:基于单条元路径的社团发现算法HCDsgl和融合多条元路径的社团发现算法HCDall。HCDsgl首先确定在给定元路径下所有节点的初始标签,再利用改进的标签传递算法进行最终的社团发现;HCDall是在HCDsgl的基础上将基于多条元路径的社团发现结果进行融合。通过在真实数据集和人工数据集上的实验验证了HCD算法的有效性。

类比社交网络的进程故障检测方法研究 下载:71 浏览:397

程自强1 黄荣2 杨洋1 《中文研究》 2018年1期

摘要:
我们周围充满了各种网络;按照相似的内在机理,可以将它们分为物理网络和信息网络。对于具有明显物理特征的网络,我们可以运用物理常识解释其内部结构或节点的性质;而对于信息网络,我们往往需要结合一些先验知识去理解,社交网络正是这样一个例子。然而,对于那些并非具有显著物理或社交背景的网络,以往并没有明确的分析思路和方法。该文将尝试运用类似于分析社交网络的方法去分析电信CSB业务系统服务器集群上的进程网络;具体地预测进程网络中节点的崩溃(故障)状态。在这个特定的进程网络上,这种建模和分析思路得到了较为可信的结果;研究表明,进程节点的运行信息(如CPU和内存使用率)、进程间的通信情况以及进程节点在整个网络中的结构特征对于判断该节点的状态具有一定的指导价值,而上述特征在时间维度上的变化量同样反映了进程/端口的状态。

速冻汤圆专用糯米核心指标的探究 下载:15 浏览:182

党允卓1 周坚1 吕庆云1 陈轩1 周康2 《中国食品与营养》 2020年6期

摘要:
为确定适宜速冻汤圆加工专用糯米的关键性指标及指标范围,以22种糯米为原料制备速冻汤圆,探讨糯米主要成分、糊化特性对汤圆质构品质的影响,并利用主成分分析建立汤圆综合品质评价模型,再通过逐步回归分析筛选出影响汤圆综合品质的关键性指标,结合聚类分析得到适宜加工汤圆的原料糯米关键性指标的范围。结果表明:糯米的水分含量、脂肪含量、峰值黏度、崩解值、回生值、最低黏度、最终黏度、热焓与汤圆的质构品质存在显著(P<0.05)相关性。影响汤圆综合品质的关键性指标为糯米原料的直链淀粉含量和脂肪含量,适宜加工速冻汤圆的原料糯米的直链淀粉含量应大于2.52%,脂肪含量应小于1.03%。

基于句内注意力机制多路CNN的汉语复句关系识别方法 下载:38 浏览:315

孙凯丽1 邓沌华2 李源1 李妙1 李洋1 《当代中文学刊》 2020年11期

摘要:
复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。非充盈态汉语复句存在隐式关系的特点给语义关系识别造成了困难。为了深度挖掘复句中隐含的语义信息,正确地实现关系分类,该文提出了一种基于句内注意力机制的多路CNN网络结构Inatt-MCNN。其中句内注意力机制模型是基于Bi-LSTM的,使其能够学习到句子的双向语义特征以及分句间的关联特征。同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征。与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果相比,该文方法的宏平均F1值为85.61%,提升约6.08%,平均召回率为84.87%,提升约3.05%。

基于序列图模型的多标签序列标注 下载:28 浏览:333

王少敬 刘鹏飞 邱锡鹏 《当代中文学刊》 2020年11期

摘要:
该文针对实际中存在对同一句话标注多种序列标签问题,定义了多标签序列标注任务,并提出了一种新的序列图模型。序列图模型主要为了建模两种依赖关系:不同单词在时序维度上面的关系和同一单词在不同任务之间的依赖关系。该文采用LSTM或根据Transformer修改设计的模型处理时序维度上的信息传递。同一单词在不同任务之间使用注意力机制处理不同任务之间的依赖关系,以获得每个单词更好的隐状态表示,并作为下次递归处理的输入。实验表明,该模型不仅能够在Ontonotes 5.0数据集上取得更好的结果,而且可以获取不同任务标签之间可解释的依赖关系。

一种基于TCLSTM的藏文词拼写检查方法 下载:39 浏览:306

华旦扎西1 才智杰2 班玛宝3 《当代中文学刊》 2020年8期

摘要:
拼写检查能够快速检测文本错误,提高文本校对效率,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。该文在分析藏文拼写检查技术和语言模型的基础上,以藏文词拼写检查为目标,选用具有长远距离记忆功能的LSTM建立TCLSTM语言模型,设计基于TCLSTM的藏文词拼写检查算法。经测试,基于TCLSTM语言模型的藏文词拼写检查取得了较好的效果。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享