请选择 目标期刊

卷积重提取特征的文档列表排序学习方法 下载:30 浏览:209

曹军梅 马乐荣 《中文研究》 2020年10期

摘要:
在许多信息检索任务中,为了进一步提高检索性能,通常需要对检索到的文档进行重新排序,目前的排序学习方法主要集中在损失函数的构造上,而没有考虑特征之间的关系。该文将多通道深度卷积神经网络作用于文档列表排序学习方法,即ListCNN,实现了信息检索的精确重排序。由于从文档中提取的多个特征中有一些特征具有局部相关性和冗余性,因此,文中使用卷积神经网络来重新提取特征,以提高列表方法的性能。ListCNN架构考虑了原始文档特征的局部相关性,能够有效地重新提取代表性特征。在公共数据集LETOR 4.0上对ListCNN进行实验验证,结果表明其性能优于已有文档列表方法。

基于LambdaMART算法的微信公众号排序 下载:24 浏览:218

渠北浚1 白宇1 蔡东风1 陈建军2 《中文研究》 2019年10期

摘要:
随着移动应用的普及,微信公众号已经成为人们获取信息的重要来源之一。微信公众号排序是获取优质信息、节约信息管理成本的必要手段。现有的公众号排序方法主要是对总阅读数、总点赞数等量化指标进行人工经验赋权得到排序结果,忽略了文章内容对公众号选择的影响。该文在保留量化指标的基础上,提出了主题垂直性、发文稳定性、主题覆盖率和主题相关性等微信篇章排序特征,使用LambdaMART算法针对上述特征集合进行排序学习,并通过主成分分析进行特征选择优化。实验结果表明,在公众号排序方面,LambdaMART方法优于现有其他方法,相关实验也证明了基于微信篇章内容分析特征的有效性。

模仿排序学习模型 下载:52 浏览:399

曾玮1 俞蔚捷2 徐君3 兰艳艳3 程学旗1 《当代中文学刊》 2020年1期

摘要:
文档排序一直是信息检索(IR)领域的关键任务之一。受益于马尔科夫决策过程强大的建模能力,以及强化学习方法强大的求解能力,近年来基于强化学习的排序模型被提出并取得了良好效果。然而,由于候选文档中会包含大量的不相关文档,导致基于"试错"的强化学习方法存在效率低下的问题。为解决上述问题,该文提出了一种基于模仿学习的排序学习算法IR-DAGGER,其基于文档标注信息构建专家策略,在保证文档排序精度的同时提高了算法的学习效率。为了测试IR-DAGGER的性能,该文基于面向相关性排序任务的OHSUMED数据集和面向多样化排序的TREC数据集进行了实验,实验结果表明IR-DAGGER在上述两个数据集上均提升了文档排序的精度和效率。

基于本体相似度与排序学习的构件检索方法研究 下载:88 浏览:374

陈华烨 汪海涛 姜瑛 陈星 《数据与科学》 2020年12期

摘要:
本文将排序学习的方法应用于构件检索的研究中。首先,采用领域本体对构件进行全面的描述,得到构件的特征描述本体集。然后,将构件特征描述本体集进行本体相似度计算得到构件与查询条件间的相对关系,并通过此相对关系对构件进行排序生成构件训练数据。最后,对构件训练数据和构件特征描述本体使用排序学习中的Plackett-Luce概率排序模型训练一种构件排序模型。测试时,当用户输入查询条件时,先对用户的查询进行语义修正,再根据构件排序模型进行检索,从而实现一种高效准确的构件检索方法。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享