PDF下载
计算机数据库技术在信息管理中的有效应用探讨

魏明芝

中国核工业第五建设有限公司,上海,200540

摘要: 在科学技术发展迅速的时代背景下,数据库技术的应用价值在信息管理领域不断增强,该技术主要应用于数据的整理和数据的分析中,就目前来看,数据库仍然是不可忽视的重要技术手段。该技术的出现和应用,能够辅佐信息管理技术的进步,具有较好的前景。基于此,本文就计算机数据库技术在信息管理中的有效应用进行简要探讨。
关键词: 计算机数据库技术;信息管理;应用
DOI:10.12721/ccn.2022.157116
基金资助:
文章地址:

1 数据库技术特点

1.1 独立性

数据库系统的二级物理模型映像为三级物理映像,二级物理模型映像使得每个用户同时能够从一个物理逻辑上抽象切换到多种逻辑方式,进行处理各类型数据,两级模型映像则保证了对于一个类型数据的逻辑分析过程具有更高的物理逻辑数据独立性。逻辑的重新独立性主要指的是通过对一个数据库的重新定义进行逻辑更新、对数据的类型进行调整,从而改变数据之间的联系方式,使数据可以有多种数据处理方式。物理的独立性主要是通过数据库来确定其所存储的位置、方式等,便于进行调整,从而形成新的数据存储体系。数据库三级模式和二级映射关系如图1所示。

图片28.png

图1 数据库三级模式和二级映射图

1.2 信息隐蔽性

信息化、网络化时代背景下,信息安全性至关重要,这也是目前计算机用户非常关注的问题。特别是企业类用户,在生产经营过程中产生大量的数字资料,其中有很多商业机密,关乎着企业生存发展,直接影响着企业经济效益。所以,如何在现代信息技术产业发展中保证数据库信息安全,对于企业以及个体用户而言,显得尤为重要。借助数据库技术的作用,可以促使计算机数据库相互建立通信连接,实现区分性的数据库信息管理,这样外部计算机用户想要访问内部信息时,也只能访问数据库的外网信息内容。但内部用户却可以利用数据库技术,操作、管理内网数据信息,真正意义上保证了用户信息的隐藏性。

1.3 信息安全性

新时期,在计算机数据库系统内,最为关键,也是重要基础的内容,就是信息安全防护,只有保证信息安全性,才能确保计算机用户使用环境安全性。对此,借助数据库编程技术,可以赋予计算机数据库进行用户身份鉴别,进而起到安全防护作用,主要操作方式就是利用用户名、用户密码的形式,全面提升数据库的数据信息保密功能,最终实现用户数据库信息安全。

2 计算机数据库技术的优化分析

2.1 表结构优化

关系型数据库有5种设计范式:第1~5范式,所有设计范式都是为了提高数据库的使用性能和提高其可扩展性。第1范式要求数据表的列具有原子性,即单表每列的数据只对应程序的一个属性,不能是对应多个属性的集合;如果一定要对应集合,应该使用从数据表,并且从数据表的每一列也要保持原子性。第2范式要求必须在满足第1范式的基础上,表格中的每一条数据都可以被区分,不能有两条数据完全一致。实际上,要求数据库的每个数据表都应设置主键(PrimaryKey),主键的值在单表中具有唯一性。主键可以是1个,若1个主键不满足唯一性,则可以设置多主键,多主键的组合必须具有唯一性,但设置多主键会引起数据库增加开销,导致读写性能下降。第3范式要求必须满足第2范式,它要求在单表中的属性具有独立性,互相之间不具有依赖关系,如果具有依赖关系,则应该将所有具有依赖关系的数据列单独划分为一个数据表,并通过设置外键来表示两张数据表之间的关联性。在查询数据时,可以通过左连接查询或者右连接查询来形成用户需要获得的完整数据。对于一些关联关系特别复杂的情况,满足第3范式可能导致性能下降,此时可以建立视图,预置复杂的连接查询,提高查询效率。第4范式在第3范式的基础上,要求消除数据表的多值依赖,即数据表中不能存在若干行多列数据完全一致的情况。第5范式在第4范式的基础上,进一步消除传递依赖,即多个数据列之间不能形成依赖关系链。但实际上,数据库设计满足第3范式即可,过度追求完美的第5范式,将导致数据表设计过于复杂、零散,不利于实际使用,在数据量过大时,反而会引起数据库查询性能下降。

2.2 并发性能优化

①单机并发能力优化主要目标是提高单数据库的并发能力。实际上,大型数据库一般都有单独的服务器,首先,确保所有计算机资源都用于数据库服务;其次,提高存储数据库文件的计算机硬盘I/O能力,如将机械硬盘改为固态硬盘;再次,提高网络带宽和QoS服务质量,降低网络传输时延和时延抖动;最后,优化数据库的连接池,合理设置连接池的大小、等待时间、保持时间和检测参数等。②部署优化主要指应用分布式部署来提高数据库的并发性能。一是可以对数据表进行横向分裂,将数据表数据按特定规则排序后,横向拆分到不同的数据库服务器上,即通过数据分库来提高并发服务能力。二是针对并发读写冲突的问题,通过分布式服务器实现读写分离:先在后端构建一个主从同步数据库集群,将主数据库数据自动同步到从数据库,在前端服务器部署读写控制器。当要写数据时,由控制器向主数据库发起写请求,主数据库完成事务操作后,再将相同的操作同步到从服务器,实现主从数据同步;当要读数据时,前端控制器直接到从数据库读取数据。如果进一步对主数据库和从数据库进行分库,还能继续提高数据库集群的并发服务能力。读写分离的优点不仅在于提高了系统的读写并发能力,而且实现了数据的冗余备份,提高了数据的可靠性。

2.3 SQL语句优化数据库的性能

主要体现为操作响应时间,在使用SQL语句查询时,也需要根据查询目标进行优化:①避免“select*”这样的全局查询和使用“like”关键字的模糊查询,这种查询方式需要进行全表扫描,对于列数较多且数据量巨大的表来说将消耗大量系统资源,造成系统响应时间将显著延长。②缩小查询范围,通过where字句、between等范围关键字和分页查询等方式,缩小查询范围。使用子查询时,应将查询范围最小的查询语句写在最内层,这样可以快速缩小查询范围,降低后续子查询的难度。③连接查询时,使用数据量较小的表去连接查询数据量大的表,同时可以在连接的字段上建立索引,可进一步提高查询效率。SQL语句是影响数据库性能的重要因素,数据库大部分数据访问都属于查询操作,不合理的查询操作甚至有可能阻塞数据库的其他查询服务,因此,SQL语句执行查询操作时必须要优化查询效能。

3 计算机数据库技术在信息管理中的有效应用

数据库技术作为信息管理系统中的核心技术,发挥着举足轻重的作用。在信息管理系统的使用过程中,仍然出现各种问题,使得数据库技术的实际价值无法充分体现出来。所以,数据库工程师需要对数据库技术进行改进与优化,从而保证其功能与优势能够在信息管理系统中充分发挥出来。

3.1 在传统企业级软件中的应用

数据库是企业级软件必不可少的核心组成部分,企业级软件的核心架构是依据数据库结构来设计和确定的,后台业务核心逻辑就是对数据的运用、分析和持久化。以ERP、CRP等软件为代表的企业级软件,以结构化数据管理为主,基本都采用关系型数据库作为持久化存储软件。业界主流的企业级关系型数据库有MySQL、MariaDB、PostgreSQL、SQLServer和Oracle等。近年来,随着自主软件的发展和信息安全要求,国产数据库管理软件也在兴起,如南大通用、武汉达梦、华为高斯等。由于软件功能具有不确定性,随着企业业务发展和社会需求变迁,软件功能也在不断发生变化。但是数据库的表结构一旦确定并在实际运行中写入大量数据,是很难随着软件功能随意变化的,一般仅在必要的情况下才会更改已形成的表结构,此时需要有专门的表结构升级脚本,操作烦琐且风险巨大,一旦因断电或其他意外原因造成升级失败又不能回滚,将给软件客户造成极大损失,因此,在企业级软件体系中,往往设置持久化中间层来兼容软件功能变化对数据库的影响,如图2所示。持久层通过实体类与数据库的数据表建立映射关系,例如,在Java中可以通过XML或者注解的方式,在Java实体类与数据库表之间建立一对一映射关系,由持久化层来维护与数据库的连接和访问操作请求,并向上层业务逻辑代码提供API(应用可编程接口)。对数据库表的增删改查操作,简化为通过持久化层提供的API来操作实体类,由持久层将相应的操作转换为SQL语句去操作数据库,而不是程序代码直接通过SQL语句去访问数据库。在这种应用模式下,数据库不直接与软件业务逻辑代码发生关系,持久化层向业务逻辑代码屏蔽了不同厂商数据库的不一致性,提高了程序的可移植性,向数据库屏蔽了业务逻辑字段频繁变化对数据库的冲击,有利于提高软件和数据库的稳定性。

图片29.png

图 2 数据库在企业级软件的应用方式

3.2 在云计算和大数据体系中的应用

对于开源云计算管理平台OpenStack来说,MariaDB或者其他关系型数据库是部署云计算平台必不可少的基础环境,Nova、Glance和Keystone等组件都依赖数据库存放系统管理必要的结构化数据,一旦数据库遭到攻击,极有可能导致整个云计算系统崩溃。基于开源大数据处理平台Hadoop的数据仓库工具Hive,则可以视作大数据版本的关系型数据库。如图3所示。Hive将结构化数据文件映射为数据库表,通过HiveSQL可以将SQL查询语句转换为MapReduce程序来执行大数据查找和分析,它借鉴了关系型数据库的数据结构并结合Hadoop的MapReduce工具,实现了对海量关系型数据的离线查询。

图片30.png 

图3数据库管理技术

4 NoSQL数据库的分类和应用

互联网和移动互联网的发展催生了无数应用模式,微博、网购、外卖、抖音和移动社交网络等应用产生了各种不同类型的非结构化数据以及对应的数据应用,非关系型数据库发展了多个分支来适应这种需求。①“键值对”型数据库,这类数据库基于哈希算法构建哈希表,通过将一个特定的“键”和“数据”进行绑定来实现数据管理,优点是简单易部署,单数据查询效率高,但是批量数据查询效率低下,常用于大型网站的分布式缓存,如Redis等。②列存储数据库,主要用于海量数据存储。传统关系型数据库是行存储数据库,特点是以“行”为单位来管理和使用数据。大数据处理往往有选择的处理数据的部分维度,如微博词频统计、评论分析等,此时列存储更有利于数据快速读取。列存储更有利于数据读取,不利于数据插入、更新和删除等操作,同时列数据的重复性更有利于数据压缩。因此,列存储主要用于大数据领域,如HBase等。③文档数据库与“键值对”数据库类似,其以特定的格式来存储文档信息,如Json、XML等,其更高级的功能是允许键值嵌套,常用于网页数据、表单数据处理。④图型数据库适用于多对多类型的数据存储,如微博、微信等社交网络数据。

5 数据库技术未来的发展趋势

(1)数据库技术向着普及化和便利化方向发展。大数据背景下,伴随着数据检索技术以及数据挖掘技术等技术的不断发展,有效提高了用户的检索速度以及检索能力,为数据库技术的发展提供了强有力的技术支持。人工智能背景下,数据的采集、录入以及数据的处理逐渐实现智能化。

(2)数据库技术向着安全化方向发展。数据库中的数据的价值无法用金钱进行估计,正因为如此,数据库技术也不可避免受到黑客的攻击。为了应对黑客攻击,数据库中数据的组织方式正在不断地发生着改变。Hadoop以及内存数据库的出现标志着新一代数据库技术的到来,数据库技术的安全性也将迎来崭新的明天。

结束语

综上所述,随着互联网技术的深入发展,网络资源形式愈加丰富,非关系型数据库已经成为新一代网络应用的主流,但仍然不能放弃传统的关系型数据库。当前网络行业依然存在海量的结构化数据存储需求,并且随着非结构化数据的增长,与之相对应的结构化数据也将保持同步增长,关系型数据库在未来仍将保持旺盛的生命力,与非关系型数据库同步发展。

参考文献:

[1] 林志锋.基于计算机软件工程的数据库编程技术分析[J].数码设计(下),2021,10(06):141-167.

[2] 梁姣.基于计算机软件工程的数据库编程技术[J].数码设计(下),2021,10(03):135-144.

[3] 陈烨晖.基于计算机软件工程的数据库编程技术分析[J].电脑编程技巧与维护,2020,22(11):188-189,197.

[4] 程灿.计算机软件工程的数据库编程技术分析[J].数字通信世界,2020,56(04):119-134.