请选择 目标期刊

区块链技术的应用进展与发展趋势 下载:42 浏览:271

何小东 易积政 陈爱斌 《中国科学研究》 2019年11期

摘要:
从2015年以来,作为比特币底层技术的区块链技术,开始成为继物联网、云计算、大数据和人工智能之后,人们争相研究和应用的热点,并被Gartner列为未来十大技术发展趋势之一。区块链具有去中心化、共识机制、不可篡改、智能合约等特性,是一种全新的、去中心化架构的计算范式。本文在分析、比较国内外区块链研究现状和简要介绍区块链关键技术(原理)的基础上,梳理了近几年区块链技术的最新应用进展,分析当前区块链应用面临的主要问题,对区块链未来的应用前景与发展趋势进行展望,进而为未来区块链的研究和应用提供有益的启发和借鉴。

基于年龄与工资水平差异的延迟退休对我国养老保险基金收支平衡的影响 下载:78 浏览:524

于文广1 李倩1 王琦1 黄玉娟2 聂秀山3 刘健4 《中国科学研究》 2018年6期

摘要:
随着我国经济社会的发展,我国的养老保险基金收支面临越来越大的压力。本文通过建立养老保险的收入支出模型,并考虑了延迟退休的影响与年龄结构的关系,引入工龄工资,分析了延迟退休政策下养老保险基金的收支规模,结果表明,延迟退休年限越长,延迟退休对于缓解养老保险收支压力的作用越明显,在考虑工龄对工资影响的情况下,延迟退休的效果更佳明显。在延迟退休同等年限下,女性养老金的收支压力依然严峻,因此有必要优先考虑延长女性延迟退休年限。

基于嵌入式的自感应系统设计 下载:60 浏览:370

常安 万振凯 《中国仪器》 2020年2期

摘要:
设计了一套具有光线感应、温湿度感应及距离感应功能的自感应系统,系统采用的控制设备是树莓派并基于光照强度传感器、温湿度传感器、HC-SR04传感器等核心组件。另外搭配继电器、L298N驱动板、步进电机等辅助组件形成了一个具有探测环境及土壤、环境温湿度、光线强弱、障碍物距离等多种功能的智能小车。该小车具备环境监测功能、自动避障功能以及根据光线强弱调节灯光的功能。

增强现实技术在教学活动中的应用研究 下载:45 浏览:490

何朝杰 彭韧 张雪 《设计研究》 2019年5期

摘要:
增强现实技术是虚拟现实技术的一个分支,它通过将计算机生成的虚拟信息和真实世界进行融合,让用户在虚实结合的环境中进行体验和互动。在教学活动中运用增强现实技术对学生创新和应用能力的培养都有积极的作用。文章简要论述了如何在教学活动中利用增强现实技术帮助学习过程更加简单易懂,并提高学习者的兴趣和学习效率。

基于视觉的室内四旋翼无人机目标追踪系统设计 下载:51 浏览:364

龚子然1 代勇1 王响2 王玉花1 《中国仪器》 2018年5期

摘要:
针对无人机在室内飞行无法依靠GPS定位飞行,还有一些人员无法到达的地点进行关键信息的搜寻工作问题,设计了一种基于视觉的室内四旋翼无人机目标追踪系统,实现室内定位自主飞行与物体自主识别跟踪功能。

汉语委婉语语言资源建设 下载:32 浏览:438

张辰麟1 王明文1 谭亦鸣2 肖文艳1 《中文研究》 2020年12期

摘要:
委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63 000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。

面向国防科技领域的技术和术语语料库构建方法 下载:25 浏览:364

冯鸾鸾 李军辉 李培峰 朱巧明 《中文研究》 2020年11期

摘要:
互联网存在海量的文献和科技信息,隐含着大量高价值情报。识别国防科技领域中的技术和术语可以为构建国防科技知识图谱奠定基础。该文基于此领域的海量军事文本,以维基百科中军事领域的新技术为基点采集语料,涵盖了新闻、文献和维基百科三种体裁。在分析军事技术文本特点的基础上制定了一系列标注规范,开展了大规模语料的标注工作,构建了一个面向国防科技领域的技术和术语语料库。该语料库共标注了479篇文章,包含24 487个句子和33 756个技术和术语。同时,该文探讨了模型预标注策略的可行性,并对技术和术语类别在不同体裁上的分布以及语料标注的一致性进行了统计分析。基于该语料库的实验表明,技术和术语识别性能F1值达到70.40%,为进一步的技术和术语识别研究提供了基础。

利用门控机制融合依存与语义信息的事件检测方法 下载:52 浏览:365

陈佳丽 洪宇 王捷 张婧丽 姚建民 《中文研究》 2020年11期

摘要:
句子级事件检测任务目的是识别和分类事件触发词。现阶段工作主要将句子作为神经分类网络的输入,学习句子的深层语义信息,从而优化句子表示来改进事件检测任务的性能。该文发现除句子语义信息外,依存树包含的句法结构信息也有助于获取准确的句子表示。为此,该文采用双向长短时记忆网络对句子进行编码,捕获其语义信息;同时,设计图神经网络对句子的依存结构进行表示,获取其依存信息;此外,在对句子进行语义编码与依存编码时,该文利用自注意力机制使模型选择性地关注句子中的不同词,从而捕获句子中有助于事件检测的关键信息,并尽可能避免无关词的干扰;最后,该文提出门控机制,通过加权实现上述两种信息的动态融合。该文在自动文本抽取(automatic content extraction, ACE)数据集上进行实验,结果显示,该文提出的动态融合语义信息与依存信息的方法能更加有效地对句子进行编码,并捕获句子中的事件信息,在触发词识别与事件类型分类这两个子任务中,F1值均有较大提升,分别达到76.3%和73.9%。

基于对话结构和联合学习的情感和意图分类 下载:42 浏览:251

张伟生 王中卿 李寿山 周国栋 《中文研究》 2020年10期

摘要:
在社交媒体中存在大量的对话文本,而在这些对话中,说话人的情感和意图通常是相关的。不仅如此,对话的整体结构也会影响对话的情感和意图,因此,需要对对话中的情感和意图进行联合学习。为此,该文提出了基于对话结构的情感、意图联合学习模型,考虑对话内潜在的情感与意图的关联性,并且利用对话的内在结构与说话人的情感和意图之间的关系,提升多轮对话文本的每一子句情感及其意图的分类性能。同时,通过使用注意力机制,利用对话的前后联系来综合考虑上下文对对话情感的影响。实验表明,联合学习模型能有效地提高对话子句情感及意图分类的性能。

基于篇章主题的中文宏观篇章主次关系识别方法 下载:40 浏览:249

孙振华 周懿 朱巧明 蒋峰 李培峰 《中文研究》 2020年9期

摘要:
篇章分析是自然语言处理领域研究的热点和重点。作为篇章分析的任务之一,篇章主次关系研究篇章的主要和次要内容,从而更好地理解和把握篇章的核心内容。该文重点研究宏观领域的中文篇章主次关系,提出了一种基于篇章主题的中文宏观篇章主次关系识别方法。该方法利用篇章单元间、篇章单元与篇章主题间的语义交互来识别主次关系,并有选择地应用篇章主题信息,有效提高了主次关系核心的识别。在中文宏观汉语篇章树库(MCDTB)上的实验结果显示,该方法优于目前性能最好的基准系统。

面向中朝跨语言文本分类的双语主题词嵌入模型的研究 下载:36 浏览:401

王琪 田明杰 崔荣一 赵亚慧 《中文研究》 2020年9期

摘要:
针对日渐丰富的少数民族语言资源进行管理、研究和使用有着重要的应用价值。为了解决语言差异引起的语言鸿沟,针对中朝两种语言环境下的跨语言文本分类任务,提出了双语主题词嵌入模型。该文将词嵌入模型与主题模型扩展到双语环境,并将两种模型相结合,解决了歧义性对跨语言文本分类精度带来的影响。首先,在大规模单词级别对齐平行句对中训练中朝单词的词嵌入向量;其次,利用主题模型对中朝分类语料进行表示,并获得中朝单词的含有主题信息的词嵌入向量;最后,将中朝单词的主题词嵌入向量输入至文本分类器,进行模型的训练与分类预测。实验结果表明,中朝跨语言文本分类任务的准确率达到了91.76%,已达到实际应用的水平,同时该文提出的模型可以对一词多义单词的多个词义有很好的表示。

基于神经网络的藏文正字检错法 下载:32 浏览:293

色差甲1 慈祯嘉措1 才让加1,2 华果才让1 《中文研究》 2020年9期

摘要:
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。

部首感知的中文医疗命名实体识别 下载:69 浏览:453

李丹1,2 徐童1,2 郑毅3王喆锋3 陈恩红1,2 《中文研究》 2020年9期

摘要:
人工智能技术的发展推动了医疗领域的智能化,为提升医疗效率、改善医疗水平提供了新的助力。同时,这一新的趋势也催生了海量的电子病历文本,其所蕴含的丰富信息具有巨大的潜在挖掘与应用价值。然而,当前中文电子病历的命名实体识别研究工作并没有全面考虑中文及中文医疗领域的特殊性,而是将面向通用数据集的模型迁移到医疗领域的实体类型中,分析效果较为有限。针对这一问题,该文设计了长短期记忆网络与条件随机场的联合模型并引入BERT模型;在此基础之上,考虑到医疗领域命名实体鲜明的部首特征,通过将部首信息编码到字向量中,并且结合部首信息修改条件随机场层得分函数的计算方式,有效地提升了医疗领域命名实体的抽取能力。通过两项电子病历数据集的实验结果表明,该文提出的模型整体效果略高于通用的实体识别模型,并对疾病诊断等特定类型的实体词的识别效果具有较为明显的提升。

基于原型网络的细粒度实体分类方法 下载:48 浏览:361

任权 《中文研究》 2020年8期

摘要:
细粒度实体分类任务作为命名实体识别任务的扩展,其目的是根据指称及其上下文,发掘实体更细粒度的类别含义。由于细粒度实体语料的标注代价较大,标注错误率较高,因此该文研究了在少量样本情况下的细粒度实体分类方法。该文首先提出了一种特征提取模型,能够分别从单词层面以及字符层面提取实体信息,随后结合原型网络将多标签分类任务转化为单标签分类任务,通过缩小空间中同类样本与原型的距离实现分类。该文使用少样本学习以及零样本学习两种设置在公开数据集FIGER(GOLD)上进行了实验,在少样本学习的设置下,较基线模型在三个指标中均有提升,其中macro-F1的提升最大,为2.4%。

基于CFN和篇章主题的概括型问答题的解答 下载:65 浏览:402

杨陟卓1 李春转1 张虎1 钱揖丽1 李茹1,2 《中文研究》 2020年8期

摘要:
相对于普通阅读理解,高考语文阅读理解难度更大,问句更加抽象,答案候选句的抽取除了注重与问句的相似性分析,还注重对材料内容以及作者的观点的概括归纳。因此该文提出了利用汉语框架网(Chinese FrameNet)抽取与问句语义相似的候选句的方法,通过识别篇章主题(段落主题句和作者观点句),生成与问句相关的内容要点以及作者的观点态度,最终选取top 6作为答案句。在近12年北京市高考真题上进行测试,召回率达到了68.69%,验证了该方法的有效性。

基于深度神经网络的诗词检索 下载:24 浏览:259

梁健楠1,2,3 孙茂松1,2,3 矣晓沅1,2,3 《中文研究》 2020年8期

摘要:
中国古典诗词是中国古典文学的代表之一,是中华传统文化的宝藏,源远流长。中国古典诗词研究是自然语言处理方向的一项重要且富有意义的工作。随着人工智能的发展,人工神经网络在图像、文本等领域得到广泛的应用,取得了显著的突破,给人工智能与中国古典诗词相结合提供了新的思路和方法。让机器去理解中国古典诗词的韵律和意境是一项极具挑战的工作,其中,通过研究诗词的相似性来提升机器对诗词的理解这一研究课题被赋予了更为重要的意义。诗词检索是对诗词内容做对比,查找出在语义和意境上相接近的诗词,这要求对整首诗词的内容和意境有深入的理解。该文模型以数十万首古诗作为基础,利用循环神经网络(RNN)自动学习古诗句的语义表示,并设计了多种方法自动计算两首诗之间的关联性,以此计算两首诗词之间的语义距离,实现诗词的推荐。自动评测和人工评测的实验结果都表明,该文模型能够生成质量较好的诗词检索结果。

一个面向中文古诗词理解难易度的人工标注数据集 下载:46 浏览:414

刘磊1,2 何苯1,2 孙乐2 《中文研究》 2020年7期

摘要:
向读者推荐阅读难度合适的古诗词有助于提升读者的诗词鉴赏能力。现阶段,围绕古诗词可读性自动化分析的相关研究的突出局限之一是缺乏大规模高质量的数据集。针对该问题,该文研究面向古诗词可读性自动化分析的数据集构建。该文作者对外开放了包含1 915篇古诗词的标注阅读理解难度的数据集(1)。该文首先将数据集划分成易中难三级,构建数据集APRD;然后进一步细化标注,构建六级分类数据集APRD+。抽取教材中的诗词组成标准集,以年级为标准难度级别,计算标准集与APRD、APRD+之间的Spearman相关性,Spearman系数分别为0.786与0.804,表明该数据集标记结果与标准集具有较高一致性。该文提取了字频、注释数等古诗词特征,采用SVM、随机森林等算法进行了初步古诗词阅读理解难易度分类测试。文内提出的古诗词可读性数据集与实验结果可作为后续研究的测试基准。

基于迭代式回译策略的藏汉机器翻译方法研究 下载:52 浏览:260

慈祯嘉措1,2 桑杰端珠1,2 孙茂松3 周毛先1,2 色差甲1,2 《中文研究》 2020年6期

摘要:
该文通过稀缺语言资源条件下机器翻译方法的研究以提高藏汉机器翻译质量,同时希望对语言资源匮乏的其他少数民族语言机器翻译研究提供借鉴。首先该文使用164.1万句对藏汉平行语言资源数据在Transformer神经网络翻译模型上训练一个基线系统,作为起始数据资源,然后结合翻译等效性分类器,利用迭代式回译策略和译文自动筛选机制,实现了稀缺资源条件下提升藏汉神经网络机器翻译性能的有效模型,使最终的模型比基准模型在藏到汉的翻译上有6.7个BLEU值的提升,在汉到藏的翻译上有9.8个BLEU值的提升,证实了迭代式回译策略和平行句对过滤机制在汉藏(藏汉)机器翻译中的有效性。

基于抽象语义表示的汉语构式标注与分析 下载:19 浏览:358

黄彤1 李斌1 闫培艺1 戴玉玲1 曲维光2 《中文研究》 2020年5期

摘要:
构式作为组成成分与实际意义不能完全对应的结构,与常规句子差异较大,对句法和语义分析器的影响较大,构式的自动分析则更是困难。因此,亟需研究构式的结构标注方法及构建相应语料库。由于构式的语义结构与句法结构有较大差异,该文使用中文抽象语义表示(CAMR)来直接标注构式的语义结构。目前收录最全的构式库是北京大学现代汉语构式知识库,通过对该构式库1 057条构式进行人工标注并统计后,发现CAMR可以表示出61.2%的基本符合组合原则的构式;而38.8%不符合组合原则的构式需要修改或添加概念,存在缺少概念、组成成分难以拆分、修辞意义难以表示等情况。该文给出的策略是将其整体作为一个谓词标注或只标注其表层义。汉语构式库的标注可以为构式语义的自动分析提供理论与数据基础。

基于Transformer的AMR-to-Text生成 下载:37 浏览:291

朱杰 李军辉 《中文研究》 2020年5期

摘要:
抽象语义表示到文本(AMR-to-Text)的生成任务是给定AMR图,生成相同意义表示的文本。可以把此任务当成一个从源端AMR图到目标端句子的翻译任务。然而,传统的序列到序列(seq2seq, S2S)方法使用循环递归网络进行编码,并不能很好地解决长距离依赖的问题。当前最好的性能是图到序列(graph2seq, G2S)的模型,使用了图模型直接对AMR图结构进行编码,但是,该方法对于非直接相连的节点依然会损失大量的结构信息。针对上述问题,基于seq2seq框架,该文提出了一种直接而有效的AMR-to-Text生成方法。在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(BPE)和共享词表的方法来联合处理未登录词(OOV)的问题。在现有的两份英文标准数据集上,实验结果都得到了显著的提升,达到了新的最高性能。
[1/20]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享