基于大数据的高考志愿填报推荐系统的设计研究
林陈钏
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

林陈钏,. 基于大数据的高考志愿填报推荐系统的设计研究[J]. 数据与科学,2023.6. DOI:10.12721/ccn.2023.157060.
摘要:
在大数据技术之下,通过Hadoop平台、Eclipse开发环境以及Java语言等针对数据信息实施提取,实施数据清洗以及分析,进而可以使得高考志愿填报推进系统可以被建设成功。其中,高考填报系统建设的数据基础就是理念志愿填报信息、考生具体分数以及兴趣爱好等,可以实现数据信息的进一步勾连,展开详细分析,通过推荐算法,当考生输入自己的分数、专业以及地域等基础信息,系统就可以为考生推荐与之相适宜的志愿填报推荐。
关键词: 大数据;高考;志愿填报;推荐系统
DOI:10.12721/ccn.2023.157060
基金资助:

高考属于我国全国统一考试之中最为关键的考试之一,获得社会十分广泛的关注。特别是浙江考生填报高考志愿之时,需要填写80个志愿,很多学生都会出现迷茫心理,并没有系统以及明确的选择。为了可以帮助广大考生都可以选择出更为适合的学校与专业,通过历年高考实际填报的数据,并且充分结合考生自身信息,通过大数据技术,为高考志愿填报设置出推荐系统,在考生填报高考志愿的时候,就可以主动为其体检出志愿以及专业。基于此,本文主要针对基于大数据的高考志愿填报推荐系统的设计实施以下相关分析和阐述,希望具有一定借鉴价值。

一、大数据处理的主要技术

大数据处理关键技术实际包含:第一,大数据预处理,将今年高校专业计划与往年分数进行精准匹配,通过对大数据技术的运用,针对历年高考的分数进行调取与分析,做到科学统筹,在大数据技术支持下,检索数据,展开分数的科学统计,使得分数与报考志愿之间相匹配。

第二,大数据预处理基础就是针对实际获取到的数据展开辨析、抽取以及清洗等。在大数据预处理之下,能够使得更为复杂化的数据直接转变为十分容易进行处理的基本数据结构。针对一些工作人员不关心的数据信息,能够将其去除[1]。进而可以真正实现数据分析处理的基本目的。第三,大数据存储以及管理要具备更为充足空间,针对数据资源实施有效存储,通常都是利用Hadoop的HDFS系统来针对数据进行存储。第四,大数据分析技术就是通过大数据处理技术之下,来调查分析用户实际兴趣以及其自身网络行为等,可以将Hadoop生态系统内部的Hive、HBase等相应技术展开应用,充分结合大数据处理算法实施数据信息的科学分析。第五,大数据可视化技术就是将数据分析最终结果更为形象地向用户进行展示,使得用户可以十分直观地观看到最终分析结果,比如实施图形展示以及网络展示等。

二、 基于大数据的高考志愿填报推荐系统Hadoop集群的构建

Hadoop集群搭建主要可以将其分成三种,分别为单机版、伪分布式以及完全分布式。在这个系统之中,设计人员通过完全分布式方法来进行Hadoop环境的搭建,依照Hadoop系统框架实施集群的创建。

(一)准备工作

做好建设相关准备工作,在腾讯云上直接展开高考志愿填报推荐系统,待建设完成之后,技术人员需要测试系统的流畅性,找出是否存在bug,完善系统的建设。

(二)搭建Hadoop环境

第一步,直接在腾讯云服务器之上搭建Hadoop。  

第二步,在计算机中安装CentOS6.8系统。针对用户名以及密码都要设置为Hadoop,待安装之后,需要将主机名改成Hadoop,对于 ip地址的设置,需要设置静态的192.168.170.128,同时针对设置地址展开映射[2]。针对主机名进行修改的主要方法是:使得系统用户直接切换成root用户,通过vi 命令来将系统之下的/etc/sysconfig/network文件进行打开,使得HOSTNAME=一行修改为HOSTNAME=Hadoop, 最终将文件保存,然后将计算机重启即可。而修改地址映射主要手段是:使得系统用户直接切换为root用户,通过vi命令将系统内部的/etc/hosts文件打开,然后在其中最后一行添加192. 168.170.128 Hadoop,将文件进行保存即可。第三步,安装JDK,给予Linux系统之下/etc/profile文件下来科学配置JKD环境实际变量。第四步,在安装Hadoop的时候,将其原本配置文件以及环境变量实施修改。第五步,将 Hadoop集群进行启动,测试整体启动是否真正成功。

三、基于大数据的高考志愿填报推荐系统的实际设计

基于大数据的高考志愿填报推荐系统主要可以分为前台与后台这两个关键部分,前台实际用户就是考生,通过网页具体形式展开设计。考生在登录系统之后,可以查阅之前五年的考生录取信息,在系统中输入自身分数、意向专业以及省份等等,这样就可以查询到适合自己的学校以及专业。而后台主要是管理员,管理员能够对于用户信息实施科学整理,将从前的录取信息展开更新,将新志愿的推荐信息也要进行更新。针对数据进行处理,主要通过以下方式:在高考信息有关网站以及APP等相应平台之上,实施信息搜集,获得高考信息志愿填报的有关数据,针对数据展开清洗,利用Hadoop针对数据实施科学归纳,将考生录取年份、省份以及分数和人数等实施筛选。最终将实际清洗过的数据上传至Hive表之中[3]

结束语:

总而言之,基于大数据高考志愿填报推荐系统可以帮助学生在实际填报志愿的时候提供更多科学参考,为考生推荐相适宜的志愿,这在未来具有良好的发展前景。但是系统设计依然具有相应问题,比如出现推进不够精确以及推荐信息较为有限等,这都是未来针对系统设计需要完善的内容,继续针对系统展开科学改进,完善推荐系统内部算法,将系统界面进行美化,促进高考志愿填报推荐系统整体的操作与使用变得更为便捷。

参考文献:

[1]高丽丽,樊彩虹. 基于大数据的高考志愿填报推荐系统的设计[J]. 电子技术与软件工程,2021,(22):213-215.

[2]张名文,蔡威,白鹤龙. 基于大数据的高考志愿填报指导系统设计与实现——以长春师范大学为例[J]. 当代教育实践与教学研究,2019,(24):41-42+44.

[3]许焕新,崔秀艳,李战军. 基于大数据的高考志愿辅助填报系统设计与实现[J]. 河北软件职业技术学院学报,2019,21(02):1-4.

林陈钏,男,汉族,籍贯:浙江温州  生于:1983-01,工作单位:浙江安防职业技术学院,单位省市:浙江省温州市,单位邮编:325000,职称:助理工程师,硕士学历,研究方向:教育信息化研究

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。