请选择 目标期刊

融入注意力机制的越南语组块识别方法 下载:70 浏览:318

王闻慧1 毕玉德2 雷树杰1 《中文研究》 2019年10期

摘要:
对于越南语组块识别任务,在前期对越南语组块内部词性构成模式进行统计调查的基础上,该文针对Bi-LSTM+CRF模型提出了两种融入注意力机制的方法:一是在输入层融入注意力机制,从而使得模型能够灵活调整输入的词向量与词性特征向量各自的权重;二是在Bi-LSTM之上加入了多头注意力机制,从而使模型能够学习到Bi-LSTM输出值的权重矩阵,进而有选择地聚焦于重要信息。实验结果表明,在输入层融入注意力机制后,模型对组块识别的F值提升了3.08%,在Bi-LSTM之上加入了多头注意力机制之后,模型对组块识别的F值提升了4.56%,证明了这两种方法的有效性。

Transformer-CRF词切分方法在蒙汉机器翻译中的应用 下载:18 浏览:175

苏依拉 张振仁 庆道尔吉 牛向华 高芬 赵亚平 《中文研究》 2019年6期

摘要:
基于编码—解码(端到端)结构的机器翻译逐渐成为自然语言处理之机器翻译的主流方法,其翻译质量较高且流畅度较好,但依然存在词汇受限、上下文语义信息丢失严重等问题。该文首先进行语料预处理,给出一种Transformer-CRF算法来进行蒙古语词素和汉语分词的预处理方法。然后构建了基于Tensor2Tensor的编码—解码模型,为了从蒙古语语料中学习更多的语法和语义知识,该文给出了一种基于词素四元组编码的词向量作为编码器输入,解码阶段。为了进一步缓解神经网络训练时出现的词汇受限问题,该文将专有名词词典引入翻译模型来进一步提高翻译质量和译文忠实度。根据构建模型对不同长度句子进行实验对比,表明模型在处理长时依赖问题上翻译性能得到提高。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:17 浏览:193

1.重庆大学计算机学院;2.上海拍拍贷金融信息服务有限公司 《中文研究》 2018年12期

摘要:
否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征对覆盖域进行识别。中文否定与不确定信息语料上,触发词识别取得F1值为91.03%,覆盖域识别在该语料的子语料财经新闻上取得F1值最高为73.91%。实验结果表明,这一模型在汉语否定触发词识别和覆盖域识别上取得的效果优于CRF模型和BiLSTM模型。

一种新的朝鲜语词性标注方法 下载:45 浏览:364

金国哲 崔荣一 《中文研究》 2018年9期

摘要:
朝鲜语词性标注是朝鲜语信息处理的基础,其结果直接影响后续朝鲜语自然语言处理的效果。首先为了解决朝鲜语词性标注中遇到的形态素实际写法与原形不一致的问题,该文提出了一种在seq2seq模型的基础上融合朝鲜语字母信息的朝鲜语形态素原形恢复方法;其次,在恢复形态素原形的基础上,利用LSTM-CRF模型完成朝鲜语分写及词性标注。实验结果表明,该文提出的方法词性标注F1值为94.75%,优于其他方法。

基于多特征Bi-LSTM-CRF的影评人名识别研究 下载:48 浏览:382

禤镇宇1 蒋盛益1,2 张礼明1 包睿1 《当代中文学刊》 2019年8期

摘要:
近年来电影行业蓬勃发展,相关的信息抽取和分析技术日益受到行业内的重视,其中对电影主创人物的分析尤为重要。而电影评论作为观影群体的主要反馈信息,具有重要的分析价值。如何从影评中自动抽取主创人名成为重要的基础工作。然而评论中观众对人物的称谓方式多样复杂,而且新电影的影评中往往存在大量人名未登录词,传统方法难以有效识别。针对影评的这些特点,该文提出一种基于多特征Bi-LSTM-CRF的影评人名识别方法。该方法通过利用外部人名语料和未标注影评提取字符级的特征,并采用Bi-LSTM-CRF模型进行人名字符序列标注。实验结果表明,该方法能够有效识别影评中的复杂称谓和人名未登录词,从而有效地抽取影评中的人名实体。

基于双向LSTM与CRF融合模型的否定聚焦点识别 下载:43 浏览:470

沈龙骧 邹博伟 叶静 周国栋 朱巧明 《当代中文学刊》 2019年3期

摘要:
否定表达作为自然语言文本中常见的语言现象,对自然语言处理上层应用,如情感分析、信息抽取等,具有十分重要的意义。否定聚焦点识别任务是更细粒度的否定语义分析,其旨在识别出句子中被否定词修饰和强调的文本片段。该文将该任务作为序列标注问题,提出了一种基于双向长短期记忆网络结合条件随机场(BiLSTMCRF)的否定聚焦点识别模型,其中,BiLSTM网络能够充分利用上下文信息并抓取全局特征,CRF层能够有效学习输出标签之间的前后依赖关系。在*SEM2012评测任务数据集上的实验结果表明,基于BiLSTM-CRF的否定聚焦点识别方法的准确率(accuracy)达到69.58%,与目前最好的系统相比,性能提升了2.44%。

SCRF系统特性研究 下载:68 浏览:510

张振涛1,2 李云华1,2 李敏1,2 《动力技术研究》 2020年12期

摘要:
通过试验对SCRF进行特性研究,并通过逐步积碳做背压试验,研究SCRF与背压的关系;通过整体布置,研究温度对SCRF的影响;通过在不同碳载量下喷射尿素,研究碳载量与尿素转化效率的关系;在SCRF满碳状态下,分别设定喷尿素和不喷尿素情况,逐渐提高SCRF温度,研究尿素对被动再生影响;将SCRF积碳到不同程度下,计算箱体内的氨储,研究碳载量与氨储的关系。在试验完成后,整理试验数据,并分析理论与试验结果,按照理论指导试验,试验验证理论的指导方针,对SCRF的特性指标进行深度分析。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:21 浏览:441

朱晋1 怀丽波1 崔荣一1 尹慧2 《当代中文学刊》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:36 浏览:283

陈世梅1 伍星1 唐凡2 《当代中文学刊》 2018年12期

摘要:
否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征对覆盖域进行识别。中文否定与不确定信息语料上,触发词识别取得F1值为91.03%,覆盖域识别在该语料的子语料财经新闻上取得F1值最高为73.91%。实验结果表明,这一模型在汉语否定触发词识别和覆盖域识别上取得的效果优于CRF模型和BiLSTM模型。

CoCrFeNi-M系高熵合金的结构与相变 下载:89 浏览:458

郭亚雄1 刘其斌1,2 尚晓娟1 徐鹏1 周芳1 《新材料》 2018年2期

摘要:
高熵合金作为金属材料领域近年来的三大突破之一,其开拓性地打破了传统合金设计理念的思想囚笼,适当配比的高熵合金可制得具有高强度、高耐磨性及耐蚀性等优异性能的合金材料。Fe、Co、Cr、Ni四种元素在高熵合金体系中研究得最为广泛,并得到一定的研究成果。从CoCrFeNi-M系高熵合金的结构与相变特点切入,介绍了高熵合金的结构分类特点,分析了高熵合金相形成及其规律,阐述了合金元素对铸态高熵合金相结构的影响,探讨了高熵合金的热处理过程。最后,总结了高熵合金的研究现状及其存在的问题。

基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别 下载:37 浏览:359

杨鹤1 于红1,2 刘巨升1 杨惠宁1 孙哲涛1 程名1 任媛1 张思佳1,2 《中国水产学报》 2021年5期

摘要:
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination, MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary, DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection, SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection, SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力。结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果。研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享