文章-世纪中文出版社

陶俊1 李飞2 张飞2 陈湘贇2 李戬2 《中国土木工程》 2020年4期

摘要:

针对某临河承压水深基坑工程,通过调查问卷的形式,邀请专家对该工程稳定性与施工降水运营方面各风险源的相对重要程度打分,根据打分结果利用层次分析法构造判断矩阵,得到各风险源因子的权重。然后在此基础上结合模糊综合评判法,引入隶属度函数,进而对临河承压水深基坑稳定与降水运营风险进行了综合评价。结果表明:基于模糊-层次分析的方法可以使各层次风险源的权重和等级评价更加偏于精确。另外,与减压降水有关的风险源因子的权重较大,需要格外引起重视。研究成果可为许多临河而建的深基坑工程中相应风险源的预防与控制提供指导依据。

面向国防科技领域的技术和术语语料库构建方法下载：25 浏览：351

冯鸾鸾李军辉李培峰朱巧明《中文研究》 2020年11期

摘要:

互联网存在海量的文献和科技信息，隐含着大量高价值情报。识别国防科技领域中的技术和术语可以为构建国防科技知识图谱奠定基础。该文基于此领域的海量军事文本，以维基百科中军事领域的新技术为基点采集语料，涵盖了新闻、文献和维基百科三种体裁。在分析军事技术文本特点的基础上制定了一系列标注规范，开展了大规模语料的标注工作，构建了一个面向国防科技领域的技术和术语语料库。该语料库共标注了479篇文章，包含24 487个句子和33 756个技术和术语。同时，该文探讨了模型预标注策略的可行性，并对技术和术语类别在不同体裁上的分布以及语料标注的一致性进行了统计分析。基于该语料库的实验表明，技术和术语识别性能F1值达到70.40%，为进一步的技术和术语识别研究提供了基础。

利用门控机制融合依存与语义信息的事件检测方法下载：52 浏览：344

陈佳丽洪宇王捷张婧丽姚建民《中文研究》 2020年11期

摘要:

句子级事件检测任务目的是识别和分类事件触发词。现阶段工作主要将句子作为神经分类网络的输入，学习句子的深层语义信息，从而优化句子表示来改进事件检测任务的性能。该文发现除句子语义信息外，依存树包含的句法结构信息也有助于获取准确的句子表示。为此，该文采用双向长短时记忆网络对句子进行编码，捕获其语义信息；同时，设计图神经网络对句子的依存结构进行表示，获取其依存信息；此外，在对句子进行语义编码与依存编码时，该文利用自注意力机制使模型选择性地关注句子中的不同词，从而捕获句子中有助于事件检测的关键信息，并尽可能避免无关词的干扰；最后，该文提出门控机制，通过加权实现上述两种信息的动态融合。该文在自动文本抽取（automatic content extraction， ACE）数据集上进行实验，结果显示，该文提出的动态融合语义信息与依存信息的方法能更加有效地对句子进行编码，并捕获句子中的事件信息，在触发词识别与事件类型分类这两个子任务中，F1值均有较大提升，分别达到76.3%和73.9%。

基于对话结构和联合学习的情感和意图分类下载：42 浏览：233

张伟生王中卿李寿山周国栋《中文研究》 2020年10期

摘要:

在社交媒体中存在大量的对话文本，而在这些对话中，说话人的情感和意图通常是相关的。不仅如此，对话的整体结构也会影响对话的情感和意图，因此，需要对对话中的情感和意图进行联合学习。为此，该文提出了基于对话结构的情感、意图联合学习模型，考虑对话内潜在的情感与意图的关联性，并且利用对话的内在结构与说话人的情感和意图之间的关系，提升多轮对话文本的每一子句情感及其意图的分类性能。同时，通过使用注意力机制，利用对话的前后联系来综合考虑上下文对对话情感的影响。实验表明，联合学习模型能有效地提高对话子句情感及意图分类的性能。

电子商务发展对我国农产品消费市场价格指数的影响下载：88 浏览：419

郭婷婷《中国经济》 2018年7期

摘要:

作为农业生产与消费大国,我国农产品消费市场价格指数的波动将极大影响居民的消费习惯与生活水平。本文从近年农产品消费市场价格指数波动的国际与国内两方面的影响因素谈起,试从电子商务角度解读现代农业的产销及农产品流通困境,并提出建立在电子商务体系下的解决方案。

基于篇章主题的中文宏观篇章主次关系识别方法下载：40 浏览：230

孙振华周懿朱巧明蒋峰李培峰《中文研究》 2020年9期

摘要:

篇章分析是自然语言处理领域研究的热点和重点。作为篇章分析的任务之一，篇章主次关系研究篇章的主要和次要内容，从而更好地理解和把握篇章的核心内容。该文重点研究宏观领域的中文篇章主次关系，提出了一种基于篇章主题的中文宏观篇章主次关系识别方法。该方法利用篇章单元间、篇章单元与篇章主题间的语义交互来识别主次关系，并有选择地应用篇章主题信息，有效提高了主次关系核心的识别。在中文宏观汉语篇章树库(MCDTB)上的实验结果显示，该方法优于目前性能最好的基准系统。

清代临清贡砖质量管理探析——以乾隆万年吉地工程用砖为例下载：58 浏览：353

王铁男《历史研究进展》 2019年8期

摘要:

临清贡砖是明清时期重要的钦工物材之一,其生产技艺目前已经成为国家级非物质文化遗产。目前学界对于其生产工艺的研究相对丰富,而对于当时大规模生产背后的组织管理,尤其是针对其质量的管理措施较少探讨。乾隆八年开始,临清砖窑奉命为乾隆皇帝的万年吉地工程烧制贡砖,但在此后连续几年出现大规模砖块质量不敷使用的状况。有鉴于此,清工部连续出台多项质量管控措施,保障了工程用砖的质量和工程的顺利进行,也为清政府积累了工程物料的管理经验。但通过此事也暴露了其行政效率低下、部门间沟通不畅、官员敷衍塞责等缺陷。

基于Transformer的AMR-to-Text生成下载：37 浏览：278

朱杰李军辉《中文研究》 2020年5期

摘要:

抽象语义表示到文本(AMR-to-Text)的生成任务是给定AMR图，生成相同意义表示的文本。可以把此任务当成一个从源端AMR图到目标端句子的翻译任务。然而，传统的序列到序列(seq2seq， S2S)方法使用循环递归网络进行编码，并不能很好地解决长距离依赖的问题。当前最好的性能是图到序列(graph2seq， G2S)的模型，使用了图模型直接对AMR图结构进行编码，但是，该方法对于非直接相连的节点依然会损失大量的结构信息。针对上述问题，基于seq2seq框架，该文提出了一种直接而有效的AMR-to-Text生成方法。在这项工作中，引入了当前最优的seq2seq模型Transformer作为基准模型，并且使用字节对编码(BPE)和共享词表的方法来联合处理未登录词(OOV)的问题。在现有的两份英文标准数据集上，实验结果都得到了显著的提升，达到了新的最高性能。

基于单句表示的篇章事件可信度识别方法下载：65 浏览：455

张刘敏张赟李培峰《中文研究》 2020年4期

摘要:

事件可信度表示文本中事件的真实状况，描述了事件是否是一个事实，或是一种可能还是不可能的情形，是自然语言处理中一个重要的语义任务。目前，大多数关于事件可信度分析的方法都集中在句子级，很少涉及篇章级。该文基于卷积神经网络，结合篇章中的句子级特征（包括句子的语义、语法以及线索词特征表示），使用对抗训练来识别篇章可信度。在中英文数据集上的结果显示，该文方法与最新的实验结果相比，微平均F1值分别提高了3.51%和6.02%，宏平均F1值分别提升了4.63%和9.97%。同时，该方法在训练速度上也提高了4倍。

基于双向注意力机制的图像描述生成下载：60 浏览：42

张家硕洪宇李志峰姚建民朱巧明《中文研究》 2020年1期

摘要:

结合注意力机制的编码器—解码器框架被广泛应用于图像描述生成任务中。以往方法中，注意力机制根据当前时刻的语义信息挑选出重要的局部图像特征，进而依靠解码器的"翻译"能力将图像特征解码成文字。然而，在此过程中，单向的注意力机制并未检验语义信息与图像内容的一致性。因此，所生成的描述在准确性方面有所欠缺。为解决上述问题，该文提出一种基于双向注意力机制的图像描述生成方法，在单向注意力机制的基础上，加入图像特征到语义信息方向上的注意力计算，实现图像和语义信息两者在两个方向上的交互，并设计了一种门控网络对上述两个方向上的信息进行融合。最终，提高解码器所蕴含的语义信息与图像内容的一致性，使得所生成描述更加准确。此外，与前人研究不同的是，该文在注意力模块中利用了历史时刻的语义信息辅助当前时刻的单词生成，并对历史语义信息的作用进行了验证。该文基于MSCOCO和Flickr30k两种图像描述生成数据集，并使用两种图像特征进行了实验。实验结果显示，在MSCOCO数据集上，BLEU4分值平均提升1.3，CIDEr值平均提升6.3。在Flickr30k数据集上，BLEU4分值平均提升0.9，CIDEr值平均提升2.4。

小学体育教学中对学生进行意志品质的培养方法浅谈下载：69 浏览：329

何茵《体育学报》 2020年10期

摘要:

随着改革开放不断深入,我国的教育事业也在逐渐深化改革,对于人才的培养越来越趋向于综合性的发展。小学时期的教育作为九年义务教育的重要阶段,不应该只注重书面成绩,还要培养学生的意志品质。体育这门学科在培养学生意志品质中发挥着重要的作用,它不仅可以使学生强身健体,还可以培养学生的心理素质以及意志力,从而促进学生的全面发展。本文主要对小学体育教学中如何培养学生的意志品质进行浅谈。

融合图片主题信息的图片描述翻译下载：41 浏览：387

唐建洪宇刘梦眙姚亮姚建民《中文研究》 2019年12期

摘要:

图片描述翻译是给定图片及图片在某一语言的描述，利用翻译技术为图片生成目标语言描述的任务。观察发现，不同图片表达的场景往往不同，对应的图片描述具有明显的主题差异性。因此，利用主题信息能够提升翻译效果。然而，图片描述的内容通常较短，无法有效反映其主题。针对该问题，该文提出了一种融合图片主题信息的图片描述翻译方法。对于任意的图片描述对，该方法首先借助相似图片检索技术从维基百科图片库中检索与源图片相似的目标图片，进而利用包含目标图片的文档学习源图片的主题表示。最终，利用训练集中所有图片描述对的主题表示重新学习并获取适应主题的翻译模型。实验结果表明，借助相似图片获取信息量更为丰富的描述文本，并利用文本的主题信息强化翻译模型的方法，能够提高现有统计机器翻译系统的性能，在WMT16测试集上进行的评测显示，翻译质量的BLEU值提升了0.74个百分点。

基于结构化表示的中文事件同指消解方法下载：20 浏览：358

宦敏程昊熠李培峰《中文研究》 2019年12期

摘要:

事件同指消解是自然语言处理中一个具有挑战性的任务，它在事件抽取、问答系统和阅读理解中具有重要作用。针对事件的语义信息主要由触发词和论元表示这一个特点，该文将事件进行结构化表示并输入一个基于门控和注意力机制的模型GAN-SR(gated attention network with structured representation)，在文档内进行中文事件同指消解。首先，该模型采用语义角色标注和依存句法分析技术对事件句进行浅层语义分析，抽取事件句信息并表示为一个事件五元组。其次，将各种事件信息输入GRU进行编码，然后使用多头注意力机制挖掘事件句和事件对之间的重要特征。在ACE2005中文语料库上的实验表明，GAN-SR的性能优于目前性能最好的基准系统。

社区体育场馆建设及发展的研究下载：36 浏览：234

刘丰《体育学报》 2020年8期

摘要:

为解决我国当前体育设施无法满足广大人民群众进行体育锻炼的需求,本文采用文献资料法、访谈法、逻辑分析法,以社区体育场馆建设及发展为研究对象,对社区体育场馆建设及发展进程进行研究。研究认为,我国群众体育设施依然匮乏,以三维视角分析群众、社区体育场馆运营方、政府之间的公共关系,借鉴市场上较为成熟的运营模式,合理地进行社区体育场馆的建设与布局,提高社区居民在社区体育场馆的参与度,社区体育场馆建设方和运营方的需求,进一步推进社区体育场馆的普及率,彰显政府为民服务的作用,营造体育产业发展和人民群众进行全民健身的良好氛围。

基于卷积循环神经网络的关系抽取下载：21 浏览：201

宋睿陈鑫洪宇张民《中文研究》 2019年5期

摘要:

关系抽取是信息抽取领域一项十分具有挑战性的任务，用于将非结构化文本转化为结构化数据。近年来，卷积神经网络和循环神经网络等深度学习模型，被广泛应用于关系抽取的任务中，且取得了不错的效果。卷积网络和循环网络在该任务上各有优势，且存在一定的差异性。其中，卷积网络擅长局部特征提取，循环网络能够捕获序列整体信息。针对该现象，该文综合卷积网络抽取局部特征的优势和循环网络在时序依赖中的建模能力，提出了卷积循环神经网络(convolutional recurrent neural network，CRNN)。该模型分为三层:首先针对关系实例抽取多粒度局部特征，然后通过聚合层融合不同粒度的特征，最后利用循环网络提取特征序列的整体信息。此外，该文还探究多种聚合策略对信息融合的增益，发现注意力机制对多粒度特征的融合能力最为突出。实验结果显示，CRNN优于主流的卷积神经网络和循环神经网络，在SemEval 2010Task 8数据集上取得了86.52%的F1值。

基于层次结构的生成式自动文摘下载：53 浏览：483

吴仁守张宜飞王红玲张迎《中文研究》 2019年5期

摘要:

基于编码器—解码器架构的序列到序列学习模型是近年来主流的生成式文摘方法。但是，传统的编码器尚不能有效地对长文档进行语义编码，并且只能学习线性链结构的信息，忽视了文档具有的层次结构。而文档的层次结构(字—句—文档)有助于自动文摘系统更加准确地判断文档内不同结构单元的语义信息和重要程度。为了使编码器能够获取文档的层次结构信息，该文根据文档的层次结构对文档进行编码:首先构建字级语义表示，然后由字级语义表示构建句级语义表示。另外，该文还提出了一种语义融合单元来对输入文档不同层次的语义信息进行融合，作为最终的文档表示提供给编码器生成摘要。实验结果表明，在加入该文提出的层次文档阅读器与语义融合单元后，系统性能在ROUGE评价指标上有显著提高。

面向问句复述识别的多卷积自交互匹配方法研究下载：36 浏览：215

陈鑫李伟康洪宇周夏冰张民《中文研究》 2019年4期

摘要:

问句复述识别旨在识别两个自然问句是否语义一致。目前，基于表示学习和深度神经网络架构的复述识别技术已取得较好效果。但是，这类方法往往面临复杂度较高且训练难度较大的瓶颈。针对这一问题，该文提出一种快速的多卷积自交互匹配方法。该方法融合了多种句子特征和词义特征，并由此形成分布式表示。在此基础上，这一方法利用卷积神经网络获取短语级的句子向量表示，并利用自交互融合技术将词级与短语级的向量表示进行充分融合，借以获得多粒度句子向量表示。该文将这一方法应用于判定自然语句是否互为复述的二元分类任务中，利用Quora标准问句复述识别语料进行测试。实验结果证明，在不引入外部数据的情况下，该文所提方法与基于双向多视角匹配的基准模型具有可比的性能，但在空间复杂度上具有较高的优越性，并且获得更快训练速度。具体地，该方法训练所需的物理显存比基准模型方法下降80%，训练迭代速度快19倍。

基于联合学习的问答情感分类方法下载：42 浏览：307

安明慧1 沈忱林1 李寿山1 李逸薇2 《中文研究》 2019年4期

摘要:

面向问答型评论的情感分类在情感分析领域是一项新颖且极具挑战性的研究任务。由于问答型评论情感分类标注数据非常匮乏，基于监督学习的情感分类方法的性能有一定限制。为了解决上述困境，该文提出了一种基于联合学习的问答情感分类方法。该方法通过大量自然标注普通评论辅助问答情感分类任务，将问答情感分类作为主任务，将普通评论情感分类作为辅助任务。具体而言，首先通过主任务模型单独学习问答型评论的情感信息；其次，使用问答型评论和普通评论共同训练辅助任务模型，以获取问答型评论的辅助情感信息；最后通过联合学习同时学习和更新主任务模型及辅助任务模型的参数。实验结果表明，基于联合学习的问答情感分类方法能较好融合问答型评论和普通评论的情感信息，大幅提升问答情感分类任务的性能。

基于弱标注数据的汉语分词领域移植下载：46 浏览：210

朱运李正华黄德朋张民《中文研究》 2019年4期

摘要:

近年来，基于神经网络的分词模型在封闭领域文本上取得了很高的性能。然而，在领域移植场景下，即测试数据与训练数据的领域差异较大时，分词的性能会显著下降。该文尝试利用自动获取的弱标注数据来提升领域移植场景下的分词性能。首先，对目前性能最好的BiLSTM-CRF分词模型进行扩展，引入适用于弱标注数据的损失函数；进而提出一种简单有效的数据筛选方法，从海量弱标注数据中筛选和目前领域更相关的数据；最后，该文发现数据预处理和在神经网络中引入传统特征均可以有效提高分词性能。在SIGHAN Bakeoff 2010和ZhuXian标注测试集上的实验结果表明，该文所提方法可有效提升汉语分词领域移植性能，平均F值提高了3.6%。

基于联合学习的跨领域法律文书中文分词方法下载：32 浏览：316

江明奇严倩李寿山《中文研究》 2019年3期

摘要:

中文分词任务是自然语言处理的一项基本任务。但基于统计的中文分词方法需要大规模的训练样本，且拥有较差的领域适应性。然而，法律文书涉及众多领域，对大量的语料进行标注需要耗费大量的人力、物力。针对该问题，该文提出了一种基于联合学习的跨领域中文分词方法，该方法通过联合学习将大量的源领域样本辅助目标领域的分词，从而提升分词性能。实验结果表明，在目标领域标注样本较少的条件下，该文方法的中文分词性能明显优于传统方法。

	在线客服
	客服电话：400-188-5008
	客服邮箱：service@ccnpub.com
	投诉举报：feedback@ccnpub.com

	在线客服：：点击联系客服
	联系电话：：400-188-5008
	客服邮箱：：service@ccnpub.com
	投诉举报：：feedback@ccnpub.com