引言
随着网络社交活动的日益频繁,以书名、简介、作者图书元数据进行检索的传统图书检索模式难以满足用户需求。同时,用户浏览、评论、标签、打分等社交行为产生的海量数据促进了社会图书检索[1]成为信息检索领域的研究热点之一,受到了学术界和产业界的广泛关注。例如,在欧盟数字图书馆计划支持下,CLEF自2011年起连续6年开展了社会图书检索评测SBS@CLEF;以SBS@CLEF研究为背景,ACM SIGIR自2016年起每年都举行支持社会图书检索技术的相关研讨会。
尽管社会图书检索的相关研究已开展了多年,但目前社会图书检索性能尚不令人满意。CHIIR 2017年SCST专题研讨会指出社会图书检索将是长期的研究任务[2]。因此有必要开展社会图书检索研究,解决其基本理论问题,提升社会图书检索的性能。
1 相关工作
根据经典的风险最小化检索模型,面向信息检索的建模包括1)图书建模2)查询建模和3)基于风险最小化原则的相关度排序。下面综述这三个方向国内外研究动态,分析影响系统性能的主要原因。
在图书建模中,现有的图书模型主要基于词空间建模,将图书建模为词的集合或词空间上的向量。将用户评论这一最重要的社会信息无差别地视为与图书元数据一样的文本数据,重建图书模型[3] 。然而这种建模方法并没有取得预期效果。社会信息没有发挥应有作用的原因在于没有注意到用户评论的重要性不同、评论内部评论词的重要性不同的特点。
在查询建模中,社会图书检索环境下用户在社交媒体中的活动反映了用户的兴趣,有助于准确构建查询模型,提升检索性能[4]。现有查询模型主要依据用户的评论或用户曾阅读的图书内容,基于词频、词共现等统计信息捕获与用户兴趣重估查询模型[5]。然而,这类方法的主要问题是没有利用情感倾向性分析区分情感极性,从而导致用户不感兴趣的负面信息作为用户兴趣被引入到查询模型中,影响查询建模效果。
在图书与查询的相关度排序中,现有研究主要采用概率模型、排序学习[1]等方法实现排序。同时,研究者们也力图在这些模型中融合图书销售量、评论数、图书的评分标签、图书与用户的相似度等图书的社会信息特征。然而,这些模型受制于模型本身架构的局限,无法学习到复杂的特征间的交互关系,无法自动地完成抽象特征的生成,更无法完成有效特征的提取。深度神经网络模型的优势在于其端到端的学习框架,模型就能够自动地完成特征的交互、抽象特征的生成及有效特征的提取,从而改善学习系统的性能。
2 系统架构
2.1 总体架构
图1 社会信息的图书模型总体框架
2.2 基于社会信息的图书建模
基于社会信息的图书建模的整体架由二部分组成。
①基于BERT语言模型图书评论关键特征提取
BERT模型把Transformer编码器当作模型的主体结构,利用自注意力机制对句子进行建模,生成上下文语境敏感的动态词向量,解决了以往 Word2Vec等模型的聚义问题。
BERT模型输入是图书相关信息的词序列(题目、摘要、目录等)(w1, w2, ..., wn)、用户评论的词序列(t1, t2, ..., tm)和词序列在文本中的位置信息,输出是图书相关信息和评论的特证表达序列CBi和CRi。
②基于多层注意力机制的图书建模
在注意力机制的基础上,本文应用一个融合注意力机制的序列到序列[25]的模型解决图书建模的问题,注意力机制源于对人类视觉的研究。注意力机制主要有两个方面:决定需要关注哪部分;分配有限的信息处理资源给重要的部分。
基于多层注意力机制的图书模型采用了序列到序列的学习框架,在解码时,为解决用户评论等社会信息对图书建模的重要性不同的问题,在用户信息序列与图书之间添加注意力机制Ri,以此获得对不同用户评论的解码概率pi。
2.3 基于用户兴趣的查询建模
用户兴趣的查询建模的整体架构由三部分组成。
①基于情感倾向性分析的用户兴趣建模。采用排序逻辑回归模型建立主客观和褒贬义的情感倾向性分析模型。本文将针对社会图书检索的环境,利用用户的评论和图书评分信息对该模型进一步优化;在对用户评论进行情感倾向性分析的基础上建立用户兴趣。
②与查询相关的用户兴趣嵌入。在将查询转换为查询嵌入,用户兴趣转换为用户兴趣嵌入之后,采用余弦距离计算它们的语义相关性,获得与查询相关的用户兴趣向量。
③基于用户兴趣嵌入的查询建模。以长短期记忆网络作为深度学习的隐层,根据输入的“查询嵌入”和“与查询相关的用户兴趣嵌入”形成以查询嵌入表达的、具有语义意义的查询模型。
2.4 交互社会信息的图书检索深度排序模型
交互社会信息的图书检索深度排序模型的整体架构由三个部分组成。
①基于神经张量网的社会信息交互。神经张量网络通过引入张量使模型具备建模对象间交互关系的能力。本研究应用神经张量网实现查询模型(Q)、图书模型(B)、社会信息特征(S)这三类不同空间特征之间的交互关系。社会信息包括用户的评分、图书分级、好评比、图书销量等基本社会特征,也包括当前用户与图书读者的属性相似度、阅读相似度、兴趣相似度等复杂社会特征。
②基于卷积层和池化层的有效特征提取。利用深度卷积神经网络(包含卷积层和池化层),实现对交互信息的有效提取。
③基于多层感知器的相关性排序。利用多层感知器,进一步组合有效特征,实现相关性评分,从而给出相关性排序。
3 结论
本文针对图书元数据不足以充分表达用户真实意图的问题,以深度学习理论为指导,研究社会图书检索中查询建模、图书建模、相关度排序三个核心问题。其成果将促进社会图书检索理论发展和系统研发,提升社会图书检索系统的性能,从而使社会图书检索产生更大的社会效益和经济效益,提升用户检索体验,推动全民阅读,促进社会发展。
参考文献:
[1] 金建霖,周芳,张博文等.基于社会信息重排序的图书检索方法[J].情报工程,2016,2(05):41-49.
[2] 黄崑,陈佳琦,郑明煊等.信息搜索任务难度研究述评[J].信息资源管理学报,2020,10(04):88-98.
[3] 吴丹,程磊.信息组织与检索的研究热点与动向:语义、交互与社群[J].图书情报知识,2017(04):4-12.
[4] 柯平,石婷婷,胡娟.2019年国外图书馆学热点与前沿分析[J].文献与数据学报,2020,2(03):99-118.
[5] 王大玲,于戈,冯时等.面向社会媒体搜索的实体关系建模研究综述[J].计算机学报,2016,39(04):657-674.