请选择 目标期刊

D-Reader:一种以全文预测的阅读理解模型 下载:75 浏览:332

赖郁婷1 曾俋颖1 林柏诚2 萧瑞辰2 邵志杰1 《中文研究》 2018年10期

摘要:
该文针对2018机器阅读理解技术竞赛提出一个基于双向注意流(BiDAF)BiDAF的阅读理解模型,实作于DuReader中文问答数据集。该文观察到基线系统采用与问题最相近的段落,作为预测的筛选条件,而改以完整段落来预测答案,结果证实优于原方法。并利用fastText训练词向量以强化上下文信息,最后通过集成学习优化结果,提升效能与稳定性。此外,针对DuReader的是非类题型,该文集成两个分类模型,分别基于注意力机制(attention)与相似性机制(similarity)来预测答案类别。该模型最终在"2018机器阅读理解技术竞赛"的评比中得到了ROUGE-L 56.57与BLEU-4 48.03。

面向中文网络评论情感分类的集成学习框架 下载:25 浏览:225

黄佳锋1 薛云1,2 卢昕1 刘志煌1 吴威1 黄英仁1 李万理1 陈鑫1,3 《中文研究》 2018年4期

摘要:
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。

用于文本分类的均值原型网络 下载:34 浏览:358

线岩团1 相艳2 余正涛1 文永华1王红斌2 张亚飞1 《当代中文学刊》 2020年10期

摘要:
文本分类是自然语言处理的基本任务之一。该文在原型网络基础上,提出了按时序移动平均方式集成历史原型向量的均值原型网络,并将均值原型网络与循环神经网络相结合,提出了一种新的文本分类模型。该模型利用单层循环神经网络学习文本的向量表示,通过均值原型网络学习文本类别的向量表示,并利用文本向量与原型向量的距离训练模型并预测文本类别。与己有的神经网络文本分类方法相比,模型在训练和预测过程中有效利用了样本间的特征相似关系,并具有网络深度浅、参数少的特点。该方法在多个公开的文本分类数据集上取得了最好的分类准确率。

面向神经机器翻译的集成学习方法分析 下载:44 浏览:451

李北1 王强1 肖桐1 姜雨帆1 张哲旸1 刘继强1 张俐1 于清2 《当代中文学刊》 2019年9期

摘要:
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统准确性的目的。虽然该方法的有效性已在机器翻译评测中得到了广泛验证,但关于子模型的选择与融合的策略仍鲜有研究。该文主要针对机器翻译任务中的参数平均与模型融合两种集成学习方法进行大量的实验,分别从模型与数据层面、多样性与模型数量层面对集成学习的策略进行了深入探索。实验结果表明在WMT中英新闻任务上,所提模型相比Transformer单模型有3.19个BLEU值的提升。

集成学习之随机森林算法综述 下载:60 浏览:397

王奕森 夏树涛 《信息通信与技术》 2018年1期

摘要:
集成学习是一类非常重要且实用的方法,以简单高效著称的随机森林算法是集成学习算法的代表之一,它集成众多决策树并以投票的方式输出结果,在许多应用领域取得了巨大的成功。文章介绍决策树和随机森林算法,总结随机森林算法在性能改进、理论性质方面的研究进展,及其和深度学习算法之间的区别与联系。

基于XGBoost集成的可解释信用评分模型 下载:61 浏览:347

刘彧祺1 张智斌1 陈昊昱2 刘杨3 邵党国1 熊馨1 马磊1,3 《数据与科学》 2019年7期

摘要:
信用评分模型是在银行信贷中提供正确指导决策的有效工具。在过去几十年中,信用评分已成为金融机构日益关注的问题,目前仍是一个热门的研究课题。但是,大多数研究中追求模型的性能表现,但忽视了决策制定过程的问责机制和信任机制。本文构建的基于XGBoost集成的可解释信用评分模型在性能良好的情况下同时兼顾模型的可解释性。选择AUC为模型性能主要评价指标,在对比实验中也加入了其他两个常用评价指标:准确率和F值。结果表明,所提出的模型的平均性能优于其他比较算法。在基分类器选择,特征选择,模型集成中均考虑到了模型的可解释性。最后,提供了模型整体及对具体样本的决策解释。

基于随机子空间集成学习的中小企业信用评估方法研究 下载:57 浏览:258

王庆 姚康 《管理与科学》 2018年9期

摘要:
由于中小企业规模较小、行业分散、收益不稳定、抵押条件不足、存在一定风险等原因,多年来一直面临融资难的问题。而融资难从根本上来说是中小企业与金融机构之间的信息不对称。如何合理地评估中小企业的信用状况对于解决融资难问题起着关键性作用。基于实证分析对比了各类评估方法,并提出了一种基于随机子空间集成学习的中小企业信用评估方法,结果表明,该信用评估方法具有较低的错误分类率,能够更好地适应中小企业信用评估。

基于混合改进GSO与GRNN并行集成学习模型 下载:82 浏览:401

简书强1 倪志伟2 李敬明3 朱旭辉2 倪丽萍2 《人工智能研究》 2019年6期

摘要:
针对萤火虫群优化算法(GSO)不稳定、收敛速度较慢与收敛精度较低等问题和广义回归神经网络(GRNN)的网络结构导致预测误差的特性,提出基于混合改进萤火虫群算法与广义回归神经网络并行集成学习模型,应用于雾霾预测.首先构建融合多种搜索策略的混合改进萤火虫群优化算法(HIGSO),并使用标准测试函数验证算法性能.然后结合HIGSO与引入扰动因子的GRNN模型,建立并行集成学习模型,并通过UCI标准数据集验证模型的有效性与可行性.最后将模型应用于北京、上海和广州地区的雾霾预测,进一步验证模型在雾霾预测中的性能.
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享