请选择 目标期刊

基于上下文词向量和主题模型的实体消歧方法 下载:57 浏览:276

王瑞 李弼程 杜文倩 《中文研究》 2019年8期

摘要:
传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文方向向量,用于表征语序,并利用该模型与主题模型训练主题词向量;其次,分别计算实体上下文相似度、基于实体上下文主题的类别主题相似度以及基于主题词向量的实体主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,相比于现有的主流消歧方法,新方法是有效的。

汉藏双语旅游领域知识图谱系统构建 下载:65 浏览:326

冯小兰 赵小兵 《中文研究》 2019年8期

摘要:
旅游业是藏族地区主要的经济来源之一。然而,目前互联网上缺乏藏文旅游信息智能化服务系统,且藏文景点介绍文本也十分匮乏;相反,汉文旅游网站信息量大,但各旅游网站包含的景点不尽相同,景点介绍文本篇幅较长,且各旅游网站对同一个景点描述侧重点不同。为便于不同语言使用者能快速准确地了解景点相关的知识,该文首先在汉文旅游领域分别采用基于BLSTM神经网络模型、基于维基百科以及基于网络爬虫等形式获取与景点相关的共8种属性知识;并通过采用基于维基百科等方法构建的旅游领域汉藏词典,将获取的汉文知识迁移到藏文,其翻译覆盖率平均值达70.44%。最终,构建汉藏双语旅游领域知识图谱。

TransRD:一种不对等特征的知识图谱嵌入表示模型 下载:59 浏览:468

朱艳丽1,2 杨小平1 王良1 张志宇1 《中文研究》 2019年8期

摘要:
知识图谱嵌入是一种将实体和关系映射到低维向量空间的技术。目前已有的嵌入表示方法在对具有不对等特征的知识图谱中的实体和关系建模时存在两大缺陷:一是假定头尾实体来自同一语义空间,忽略二者在链接结构和数量上的不对等;二是每个关系单独配置一个投影矩阵,忽略关系之间的内在联系,导致知识共享困难,泛化能力差。该文提出一种新的嵌入表示方法TransRD,首先对头尾实体采用不对等转换矩阵进行投影,并用ADADELTA算法自适应调整学习率;其次对关系按相关性分组,每组关系使用同一对投影矩阵的方式来共享公共信息,解决泛化能力差的问题。在公开的数据集WN18和FB15K以及MPBC20(乳腺癌知识图谱的子集)上进行实验和结果分析并与现有的模型进行对比,结果表明TransRD在各项指标上均取得大幅提升。

面向知识库问答的实体链接方法 下载:58 浏览:367

赵畅 李慧颖 《中文研究》 2019年7期

摘要:
面向知识库问答的实体链接是指将自然语言问句中实体指称链接到知识库中实体的方法。目前主要面临两个问题:第一是自然语言问句短,实体指称上下文不充分;第二是结构化知识库中实体的文本描述信息少。因此,该文提出了分别利用候选实体的类别、关系和邻近实体作为候选实体表示的方法,弥补知识库实体描述信息不足的问题。同时,通过语料训练得到问句指称的相似实体指称作为其背景知识。最后,结合实体流行度,共同作为实体消歧的特征。实验结果表明,上述提到所有特征的线性组合在数据集上高于单个特征的结果,表现最佳。

会议场景下融合外部词典知识的领域个性化机器翻译方法 下载:43 浏览:344

刘庆峰1 刘晨璇1,2 王亚楠2 张为泰2 刘俊华2 《中文研究》 2019年6期

摘要:
会议场景下通过语音识别和机器翻译技术实现从演讲人语音到另外一种语言文字的翻译,对于跨语言信息交流具有重要意义,成为当前研究热点之一。该文针对由于会议行业属性带来的专业术语和行业用语的翻译问题,提出了一种融合外部词典知识的领域个性化方法。具体而言,首先采用联合占位符和拼接融合的编码策略,通过引入外部词典知识,在提升实体词、专业术语词翻译准确率的同时,兼顾翻译结果的流畅性。其次提出基于分类的领域旁支参数个性化自适应策略,在保持通用领域翻译效果的情况下实现会议相关领域翻译质量的提升。最后基于上述方案,设计了一套领域个性化自动训练系统。实验结果表明,在中英体育、商务和医学会议翻译任务上,该系统在不影响通用翻译的情况下,平均提升9.22个BLEU,获得较好翻译效果。

基于新HSK词汇大纲的词汇等级类推分析 下载:55 浏览:369

张引兵1,2 宋继华1 彭炜明1 郭冬冬1 张金1 《中文研究》 2019年3期

摘要:
HSK是一项国际汉语能力标准化考试。新HSK大纲中附表所列650个"默认词"多依据专家知识人工列举式的扩充。该文在《现代汉语词典》《现代汉语语法信息词典》等资源的基础上,利用知识工程的方法,迭代使用减字默认、组合默认等词汇等级类推规则,力争实现类推过程中隐性知识的显性化、分散知识的系统化,使得词汇等级类推的每一个环节都有章可循、有据可依,完成了基于新HSK大纲词汇等级的系统类推工作。接着,结合所构建的汉语词法知识库对类推结果进行了筛选,最终得到了23 762个词语的类推等级。最后,通过对类推结果的统计分析,表明该文的研究工作可以更好地发挥新HSK词汇大纲在汉语词汇定级、文本难度分级中的指导作用,也可为其他领域教学词汇大纲的制定提供一定的借鉴。

我国国际商事和解协议执行机制研究 下载:56 浏览:470

赵秀文1,2,3,4,5 《争议解决研究》 2020年6期

摘要:
我国现行商事和解协议可以通过当事人平等协商、调解、诉讼和仲裁程序中达成。通过协商和调解达成的和解协议主要依据当事人自动履行,在诉讼程序和仲裁程序中达成的和解协议可以得到法院的执行。《新加坡调解公约》项下的国际和解协议指在独立的调解程序中达成的协议,由缔约国按照当地程序规则和公约规定的条件执行。本文结合我国有关执行商事和解协议的立法与司法实践,就《新加坡调解公约》项下的国际商事和解协议在我国执行中所涉及的一些法律问题,包括东道国政府与外国投资者之间的和解协议的性质、公约项下的国际商事和解协议在我国的执行程序和执行条件、以及关于我国是否应当在近期内批准加入《新加坡调解公约》等问题,提出自己的一些思考。作者认为,无论我国在近期内是否考虑批准加入该公约,都应要尽快做好建立和完善我国商事调解法制的各项准备工作:在立法层面上尽快制定和出台规范商事调解制度的法律规则,在司法层面上由最高人民法院制定执行国际商事和解协议的各项程序规则及相关配套措施。

技术问题还是法律问题——智慧法院建设基本范式之检讨 下载:66 浏览:380

徐艳阳1,2 朱岳宁3 《争议解决研究》 2020年2期

摘要:
人工智能法律系统在理论和实际应用中有一些误区值得检讨,比如碎片化,"盲目化"和"童话化"。人工智能法律系统的典型应用主要有办公自动化;诉讼材料辅助生成;信息传输、搜索与分析;智能化在线纠纷解决平台;法律智能机器人等方面。从技术上讲,前四种应用技术已经比较成熟,基本能满足现实替代、覆盖传统办案模式的需要,但是人工智能所要求的确定性与无情性是很难达成对人的彻底模拟。法官裁判案件运用的逻辑既有形式逻辑,又有辩证逻辑。使用数理逻辑的人工智能与法律的形式逻辑性是契合的,但是,法律和司法还有着大量辩证逻辑的内容,这使得法律和司法呈现出巨大的模糊性。当人工智能发展到要尝试取代法官的时候,人工智能本身的技术问题已不难解决,难以解决的是法律问题要翻译为人工智能语言。案例大数据研究才是当下人工智能司法运用的真正空间。

第三人参加诉讼告知制度研究——以我国《民诉法解释》第81条和第327条的规定为切入点 下载:63 浏览:419

王合静 《争议解决研究》 2019年6期

摘要:
诉讼告知是第三人参加诉讼的重要途径。诉讼告知制度对第三人参加诉讼具有纠纷一次性解决、诉讼告知主体权益的维护、第三人程序配置利益的优化等重要功效。大陆法系国家和地区的诉讼告知制度关涉到诉讼告知的主体、告知的程序、告知的效力等规范。在我国第三人参加诉讼语境中,提出应赋予当事人诉讼告知之权利,限定法院诉讼通知之权限,增设诉讼告知程序之规范,并对当事人在第三人参加诉讼告知中设定救济之权利。

基于小波分析的特征提取文本分类方法研究 下载:61 浏览:343

朱晋1 怀丽波1 崔荣一1 尹慧2 《中文研究》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

朱希祖与《史通》研究 下载:32 浏览:233

全清波 《历史教学研究》 2020年9期

摘要:
如何批判、继承和发扬传统史学的理论成果,是中国史学走向现代必须面对的一大任务。朱希祖对刘知几《史通》的研究和理论借鉴便是这方面的一个例证。在教学实践和学术研究中,其对《史通》有关史书体裁体例和史官史馆等论述尤多资取。朱氏不仅有沿袭成说之处,也有以新释旧的探索,从中可见传统史学在近代西学冲击之下,虽丧失了主流地位,但仍保持着血脉延续。深入考察这一范例,不但有助于认识现代史家朱希祖的治史特征,还可从中体察传统史学在近代史学转轨中的价值和近代史学的知识演进状况。

D-Reader:一种以全文预测的阅读理解模型 下载:75 浏览:343

赖郁婷1 曾俋颖1 林柏诚2 萧瑞辰2 邵志杰1 《中文研究》 2018年10期

摘要:
该文针对2018机器阅读理解技术竞赛提出一个基于双向注意流(BiDAF)BiDAF的阅读理解模型,实作于DuReader中文问答数据集。该文观察到基线系统采用与问题最相近的段落,作为预测的筛选条件,而改以完整段落来预测答案,结果证实优于原方法。并利用fastText训练词向量以强化上下文信息,最后通过集成学习优化结果,提升效能与稳定性。此外,针对DuReader的是非类题型,该文集成两个分类模型,分别基于注意力机制(attention)与相似性机制(similarity)来预测答案类别。该模型最终在"2018机器阅读理解技术竞赛"的评比中得到了ROUGE-L 56.57与BLEU-4 48.03。

历史知识的常识化:论白寿彝的《中国通史纲要》 下载:28 浏览:223

李娟 《历史教学研究》 2020年9期

摘要:
历史知识的常识化是历史研究同现实生活发生关联的重要途径之一。白寿彝教授主编的《中国通史纲要》参与了近两代中国人的历史常识建构,书中形成了三大历史观念:马克思主义唯物史观、中华民族统一多民族国家的历史格局、以阶级斗争为动力的历史发展观,前两点已经成为了构成现代中国人历史常识的核心组成部分。通过对《纲要》的分析,可以发现历史知识的常识化是学术研究和社会、作者和读者之间互动选择的过程和结果,而历史知识的情节化及其所产生的情感共鸣,在常识化的过程中意义重大。

《现代汉语动词语义知识词典》的开发与应用 下载:57 浏览:507

孙道功1 亢世勇2 《中文研究》 2018年9期

摘要:
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。

战时日本中国史学界的一个侧面——对《异族统治中国史》成书的考察 下载:23 浏览:192

王萌 《历史教学研究》 2020年8期

摘要:
太平洋战争后期,由日本中国史学者宫崎市定等人起稿、东亚研究所编撰的《异族统治中国史》出版问世。日本军政当局通过东亚研究所对东方文化学院、东方文化研究所的课题委托,将日本中国史学界的青年精英集体吸纳入军国体制之中,学者们的研究获得充裕的经费支持,其成果则"以史喻今",为日本制定"国策"提供历史借鉴与依据。这种特殊的课题委托关系,依靠军、政、学界之间的人际脉络、学者师承关系形成的集团属性而确立,构建了战时日本知识精英与军国体制之间的互动模式。对于梳理并反思近代以来日本中国史学界的学术脉络而言,青年学者们的这段学术经历不应被选择性忽视。

约翰逊政府对印度安全保证与核问题的认知与应对 下载:20 浏览:208

柏友春 《历史教学研究》 2020年8期

摘要:
约翰逊政府时期,随着中国的核武器研制及成功进行首次核试验,美国担心印度可能会因为安全压力而走上发展核武器道路。为阻止印度获得核武器,约翰逊政府试图通过解决印度的安全保证问题从而消除它发展核武器的动机。但是,由于政府内部的分歧,美国逐渐搁置了向印度提供单边安全保证的构想。此后,对于印度试图通过《不扩散核武器条约》获得美苏联合安全保证的设想,美国也并未予以支持。因此,约翰逊政府最终未能解决印度的安全保证问题,而印度则以自身安全无法得到保障为借口,正式走上了发展核武器道路。

知识付费时代艺术作品的传播研究 下载:54 浏览:374

李楠 《中国新闻传播》 2018年12期

摘要:
人们的生活节奏加快,互联网上大量的信息充斥着我们的生活;在这充斥着焦虑感的时代,我们渴望快速获取知识,而知识付费的兴起为我们开辟了一个窗口。艺术作品作为一种知识,既有知识所具有的一般特征,也具有自身独特特征,在人们物质生活极大提高的同时,更多的人意识到提高艺术修养的重要性。本篇论文在探究艺术作品纳入知识付费体系原因的基础上,分析艺术作品的传播形式和传播障碍,最后提出艺术作品在知识付费时代有效传播的途径,希望艺术作品能够借势在新时代得到更好地传播。

利用准私密社交网络文本数据检测抑郁用户的可行性分析 下载:21 浏览:361

刘德喜1,2 邱家洪1,2 万常选1,2 刘喜平1,2 钟敏娟1,2 郭海峰3 邓松4 《中文研究》 2018年5期

摘要:
社交媒体的发展为抑郁用户的检测提供了一条新的途径。已有的相关研究通常是利用用户在Twitter、微博等社交网络平台上的用户行为数据或公开发表的文本内容,较少有利用微信朋友圈、QQ空间这种相对比较私密的社交网络数据。直观地,这类准私密社交网络数据更能反映用户的心理健康状况。该文主要讨论利用准私密社交网络文本数据检测抑郁用户的可行性,包括训练样本的选择、特征量化方法、检测模型选择和不同文本特征下的模型分类效果等。实验表明,采用平衡高低分组的方法选择样本比非平衡高低分组样本和离散化的高低分组样本训练的分类器要好;利用Z-score标准化的特征量化方法比直接使用频次或归一化频率要好;随机梯度下降模型SGD较支持向量机SVM等其他用于对比的分类模型要好。实验还发现,相对于词袋、词向量等文本特征,主题特征有较好的效果,可以使社交网络用户抑郁检测模型的F值达到0.753,而对抑郁用户的检测精度达到0.813。

从普通的工具书到庇护知识的方舟——试论狄德罗对《百科全书》期望的演变 下载:38 浏览:257

张茜茹 《历史教学研究》 2020年6期

摘要:
早自1746年,狄德罗就开始参与《百科全书》的出版计划,而这部作品竟直到1772年方告完工,前后历经20余年。在这漫长的过程中,《百科全书》的面貌发生了变化,而狄德罗对它的期望也发生了变化。从最初的翻译计划出发,狄德罗逐渐萌生出编写一部内容更丰富、更全面的辞书的想法,并希望借它来革新认识论,推进启蒙运动;随着《百科全书》的编写渐近尾声,狄德罗反而产生了一些消极情绪,担心动乱和纷争会摧毁文明,因此希望《百科全书》能成为庇护知识的方舟。由此可见《百科全书》多重的意义和多元的价值。

基于叙词表的领域知识图谱初始种子集自动生成算法 下载:42 浏览:275

韩其琛 赵亚伟 姚郑 付立军 《中文研究》 2018年4期

摘要:
随着认知计算的飞速发展,通用知识图谱的自动构建取得了极大的进步,但在垂直领域由于缺乏本体等语义信息,导致进展缓慢。叙词表广泛分布于各个专业领域且蕴藏着丰富的语义信息,如能对这些语义信息进行合理的提取和利用,必然能在一定程度上帮助领域知识图谱的自动构建。该文提出两个假设,利用假设可以从叙词表内部结构中提取实体类型和关系类型,进而设计了一种基于叙词表的领域知识图谱初始种子集自动生成算法。最后,以地质领域和林业领域的叙词表作为实验对象,采用Bootstrapping算法,利用由叙词表自动生成的初始种子集进行抽取工作,通过对抽取到的结果进行分析,结果表明利用叙词表得到的初始种子集可以取得同人工设计种子比较接近的效果。此外,所提模型具有通用性,为叙词表在构建领域知识图谱中的应用提供了一种新的思路。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享