PDF下载
大数据背景下公共图书馆信息资源服务平台建设研究

刘振

徐州工程学院管理工程学院,221018

摘要: 大数据背景下公共图书馆信息资源服务亟待创新。本文首先详细阐述了相关大数据技术,然后介绍了公共图书馆信息资源服务平台顶层设计思路和个性化推荐系统,最后基提出共图书馆信息资源服务平台建设具体举措。
关键词: 大数据;公共图书馆;服务平台
DOI:10.12721/ccn.2024.157106
基金资助:江苏高校哲学社会科学研究项目(基于对象计算的网络信息资源价值智能判断研究,项目编号: 2019SJA0968)的研究成果
文章地址:

1 引言

近些年来,大数据技术在图书馆信息资源建设方面应用广泛。当前的大数据技术已经趋于成熟,在数据存储、数据分析等方面,已经形成了一套比较完整的技术框架,相关的技术生态也在进行不断的完善。因此在大数据时代,我国公共图书馆应将信息资源建设当作发展的重要方向,运用数据挖掘技术分析大规模的数据并提炼出读者有需要的、真正具有价值的知识,提高图书的利用率。新时代的公共图书馆应顺应大数据浪潮,勇于面对图书馆在未来发展中可能遇到的挑战,保证图书馆可以长效有机发展。

2 大数据相关技术

大数据技术对数据进行采集,分析,以期可以更好地利用信息资源,该系统应用hadoop平台,Hadoop是Apache基金会开发的一个分布式系统框架。其前身Apache的Nutch是一个专门的文件系统,它结合了数据搜索和数据存储功能。Hadoop现在已经发展成为一个体系巨大的系统,包括HDFS、 Sqoop、 Yarn、 Hive、 Map Reduce, HBase、 Zookeeper等,负责分布式数据存储、并行计算、集群管理和数据传输等。其核心是Yarn、 Map reduce和HDFS。Hadoop生态圈的核心组建如图1所示。1.png3 公共图书馆信息资源服务平台顶层设计

公共图书馆信息资源服务平台主要采用经典的Model-View-Controller模式进行构建,即数据访问层、业务逻辑层和数据表现层。系统被划分为不同的三个应用层次,使图书馆管理系统所具备的功能和作用更加地明确。显然地,将系统划分为着三层来展开工作是有规律可依照的,由物理角度来说,三层架构具备着相对应的物理现象,设计为三层结构实际上可以提升系统本身的业务处理,同时可以降低系统维护以及开发的成本。

表现层是公共图书馆专业信息管理系统提供的数据界面和接口服务,来为一般员工提供功能齐全的用户界面,实现对图书馆内部信息资源的管理应实施逻辑业务管理。链接到表现层的内部系统大多数仍然是业务层,主要功能组织彼此独立存在,其功能的实现非常方便快捷,主要是基于异构建立的方法。通过向逻辑层提供一组适当的业务连接接口服务,在正常情况下,系统中的服务界面都是运用BS架构,并且系统用户可以使用浏览器来获取所需的系统访问。

业务层通过表达层提供一组对应的接口服务,当业务层借助于表达层提供对应的服务时,就可以通过表达层提供接口服务,从而间接地实现信息向外传递的目的。

数据层位于最底层,并将表示层和业务层生成的关键数据存储在数据层中。由服务层产生的关键数据也通过数据业务接口传递到数据层。此外,访问层使用业务逻辑层提供的相关关键业务组件来存取共享数据层,由服务层产生的关键数据最终通过相应的数据业务接口传送到数据层。这样,数据层就可以被放置在系统中相对隐藏的地方,并且系统操作员可以获得更方便快捷的操作方案。

4基于大数据技术的个性化推荐系统

公共图书馆信息资源服务平台的主要功能包括信息管理、借书还书、书目检索、系统管理等,其中个性化服务是近年来一个重要功能,能够满足读者的个性化需求。

大数据在个性化推荐系统中的作用机制是一个复杂而多维的过程,涉及数据收集、处理、模型训练以及最终的推荐输出。个性化推荐系统通过分析大规模的用户数据和内容数据,能够理解用户的喜好、行为习惯和消费模式,进而为用户推荐他们可能感兴趣的商品或内容。这种技术已经在多个领域得到广泛应用,例如电商平台、视频流媒体服务和社交网络等。个性化推荐系统主要分为以下步骤:

(1)数据收集。这些数据主要包括用户数据、物品数据以及用户与物品的交互数据。用户数据通常包括年龄、性别、地理位置、浏览历史、购买历史等信息。物品数据则包括商品的类别、价格、描述、标签等信息。用户与物品的交互数据包括用户的浏览记录、购买记录、评分、评论等。这些数据是推荐系统能够理解用户个性化需求的基础。

(2)数据处理。包括数据清洗、特征提取和数据归一化等步骤。数据清洗主要是去除无效或错误的数据,比如错误的用户输入、重复的记录等。特征提取则是从原始数据中提取有助于模型理解的信息,例如从用户的评论文本中提取情感倾向、从购买历史中提取购买频率等。数据归一化是将不同范围的数据转换到同一尺度,以便模型处理。

(3)模型训练。个性化推荐系统常用的模型包括协同过滤、内容推荐和混合推荐模型。协同过滤模型通过分析用户间的相似性或物品间的相似性来进行推荐。内容推荐模型则是根据物品的特征和用户的偏好进行匹配推荐。混合推荐模型结合了协同过滤和内容推荐的优点,能够更全面地理解用户的需求。

(4)推荐输出。系统会根据用户的当前上下文情况和历史行为数据,实时生成推荐列表。推荐系统还会考虑多样性和新颖性,避免总是推荐相同的或者用户已经熟悉的内容,从而提高用户体验。个性化推荐系统需要不断地进行优化和更新。系统会根据用户对推荐结果的反馈(如点击、购买、评分等)来调整推荐算法。这种反馈回路帮助系统更精准地预测用户的喜好,从而提高推荐的准确率和用户满意度。大数据技术在个性化推荐系统中扮演了至关重要的角色。通过精细化管理大量的用户数据和复杂的算法模型,推荐系统可以在庞大的信息海洋中为用户提供他们所需要的内容,极大地提升了信息的获取效率和用户的满意度。随着技术的进步,个性化推荐系统将会变得更加智能和高效。

用户在个人信息界面选择图书推荐选项,系统将根据用户的查询信息及借阅记录等进行图书推荐。在提供个性化信息推送的过程中,读者的隐私数据是应该得到保护的,在信息采集的过程中应重点采集读者的阅读需求、检索习惯等与图书馆相关的数据,要减少对读者隐私数据的采集数量。在进行数据采集之前,图书馆应告知读者自己的行为,要让读者知道自己的信息要被采集和选择是否要图书馆提供这类服务,并且在收集分析用户数据时,应对读者的姓名、电话等个人隐私数据采用相关安全技术,进行过滤,并对读者个人隐私数据进行加密处理,防止读者的个人信息资源被泄露,缩小了读者个人隐私资料的使用范围,在保证资料价值的前提下,保证了读者的个人隐私资料的安全,此外,还允许读者浏览、删除个人隐私资料等操作,加强读者对自己的隐私数据控制程度。

5公共图书馆信息资源服务平台建设举措

5.1 强化信息资源人才队伍建设

随着新一代信息技术的迅猛发展,以AIGC(生成式人工智能)为代表的AI技术正逐渐渗透到图书馆领域,加快推动数智图书馆的转型升级。为深入探讨AIGC在图书馆的实践应用,从而为用户提供更加个性化、智能化、精准化的服务,图书馆通过策划举办青年馆员能力提升班,开设线上线下专题系列讲座、派员参加相关学术会议等方式,让青年馆员掌握AIGC辅助图书馆在智能问答、AI资源导航、文本分析阅读、科研和教学支持等方面的现实应用和发展前景,并对AIGC在实际应用中存在的风险隐患进行格外重视。针对云计算、大数据技术、区块链、人工智能、物联网等新一代的信息技术,对相关人员进行培训,使他们的数字技能都能得到进一步的提升,增加他们的服务能力和专业能力,着力培养造就一支思想政治过硬、专业能力突出、适应图书馆转型发展要求的高素质青年馆员队伍,进一步夯实图书馆高质量发展基础。

5.2 提供知识可视化服务

可视化服务是一种先进的服务模式,应用于图书馆主要是通过大数据系统对馆内数据进行建模和渲染,将数据转换成具有真实感的图形,以直观形象的方式展示给读者,给予人们深刻与意想不到的洞察力。可视化服务能够顺利处理种类繁多的数据,使之变得简明易懂,同时在图书馆里可以利用可视化服务把时间的分布、数据库的分布进行可视化处理,还可以把书籍的关系进行关联,让读者通过信息摸索到相同的知识和数据。

5.3 提供知识转移服务和智慧服务

知识的转移服务是公共图书馆管理的一种新模式,即把图书馆的数据经整合和处理后转移到用户的计算机中,可谓是图书馆的创新体验,它能够把知识管理和服务统一起来。通过大数据挖掘知识的价值,再从这些有价值的知识中筛选出与用户问题相关的内容进行序化、整合,最终得到实用的、有价值的新知识,在大力提升公共图书馆资源开发效能的同时还可以运用科学的方式,制订转移目标,引进当前最新的技术手段,实现知识向用户的成功转移,开发图书馆知识服务的新功能、新类型。

智慧服务是建立在知识服务基础上的创新服务模式,是图书馆知识服务的升华。公共图书馆大数据中包含有许多用户产生的信息数据,大数据背景下,公共图书馆应充分利用大数据技术搜集用户的动态信息行为,建立用户信息档案,结合学科与行业分析用户信息行为的变化情况,智能化地选取适宜的知识提供给读者;通过对这些含有大量读者信息的数据进行分析,准确描述、定位其信息行为,把握、预测并设法满足读者的知识需求。

6 小结 

公共图书馆想要持续发展就必须要进行信息资源建设,新一代信息技术的发展迅猛,尤其是大数据相关技术的广泛应用,给公共图书馆持续发展带来挑战,也是公共图书馆创新服务方式的好时机,为了提供更优质的服务,提升读者对公共图书馆的满意程度,需增加图书馆的信息资源建设力度,在大数据技术的基础上对图书馆的信息资源进行进一步合理的分配和利用,应用大数据技术对系统里的功能进行更新,除借还书等基础功能外,还应增加对读者个人及借阅信息的分析与研究,挖掘读者的潜在需求,为读者提供个性化图书推荐,加强对图书馆电子资源的重视,从而提升图书馆信息资源建设水平。

参考文献:

[1]李国新.公共图书馆专业化发展的挑战与变革[J].图书馆论坛, 2023, 43(12):9-14.

[2]吕少平.探索公共图书馆报纸文献智慧化服务的管理模式[J].数字与缩微影像, 2024(2):10-12 

作者简介:刘振,博士,副教授,长期从事智能信息处理与企业信息化方面的研究工作。