数据与科学
数据与科学
《数据与科学》系开放获取期刊,主要刊登数据技术应用领域中具有前瞻性、独立性和创新性的产业与技术发展见解;产业的新研究应用成果与发展动态;关键技术、热点的前沿性研究与应用;具有先进性和推广价值的应用方案等。本刊支持思想创新、学术创新,倡导科学,繁荣学术,集学术性、思想性为一体,旨在给世界范围内的科学家、学者、科研人员提供一个传播、分享和讨论数据科学领域内不同方向问题与成果的学术交流平台。

ISSN: 3078-9834

《数据与科学》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。



提示文字!

注:我们将于1~7个工作日告知您审稿结果,请耐心等待;

您也可以在官网首页点击“查看投稿进度”输入文章题目,查询稿件实时进程。

  • 基于XGBoost集成的可解释信用评分模型 下载:61 浏览:352
  • 刘彧祺1 张智斌1 陈昊昱2 刘杨3 邵党国1 熊馨1 马磊1,3 《数据与科学》 2019年7期
  • 摘要:
    信用评分模型是在银行信贷中提供正确指导决策的有效工具。在过去几十年中,信用评分已成为金融机构日益关注的问题,目前仍是一个热门的研究课题。但是,大多数研究中追求模型的性能表现,但忽视了决策制定过程的问责机制和信任机制。本文构建的基于XGBoost集成的可解释信用评分模型在性能良好的情况下同时兼顾模型的可解释性。选择AUC为模型性能主要评价指标,在对比实验中也加入了其他两个常用评价指标:准确率和F值。结果表明,所提出的模型的平均性能优于其他比较算法。在基分类器选择,特征选择,模型集成中均考虑到了模型的可解释性。最后,提供了模型整体及对具体样本的决策解释。
  • 基于退化混合估计技术的改进 下载:42 浏览:432
  • 陈斌杰 陆志华 周宇 叶庆卫 《数据与科学》 2019年7期
  • 摘要:
    退化混合估计技术是一种用于立体声音频的双通道欠定盲源分离方法。为了提高源信号的分离质量,对退化混合估计技术进行了改进。首先,针对混合参数估计不精确的问题,利用MCFT变换代替STFT变换进行时频表示来构建直方图。其次,针对理想二进制时频掩码在分离时产生部分时频点丢失的问题,利用Gammatone滤波器将二进制时频掩码进行平滑处理,从而更好的重建源。通过仿真结果表明,改进后的方法语音分离性能显著提升。
  • 利用QoS实现城域网全业务差异化服务 下载:77 浏览:338
  • 孙海英 曲凡波 《数据与科学》 2019年7期
  • 摘要:
    随着IPTV业务的发展和宽带提速工作的快速推进,如何对现有IP网络进行资源优化,根据用户的不同需求提供差异化的服务,成为当前的一个重要技术课题。QoS技术能够针对用户在吞吐量、时延、抖动、丢包率等方面的不同需求,提供不同的网络服务。本文以某地IP城域网为例,介绍了QoS在IP城域网上的全业务端到端的部署原则、实施要点及效果等内容,为充分利用QoS技术实现网络资源优化、提升业务感知提供了参考方案。
  • 基于无人船应用案例的无线网络技术课程教学研究 下载:70 浏览:317
  • 胡奔 金光 朱家骅 江先亮 《数据与科学》 2019年6期
  • 摘要:
    本文调研了目前高校无线网络技术课程相关教学现状,总结出学生缺乏实验实践项目、应用开发能力不足等问题。对此,具体设计实现了无人船系统,应用低功耗广域物联网(LoRa)技术,实现了水质监测、无人船控制等功能。从软硬件选型、系统框架构建、子部件设计到系统集成与测试等一系列完整开发环节,让学生深入理解物联网和无线网络技术应用项目的开发流程和各环节的工作内容。实际教学效果较好,提高了学生对无线网络技术的理解和应用能力,有效体现了理论联系实际的过程。
  • 现代高速公路机电通信系统新技术分析 下载:67 浏览:357
  • 张亢 《数据与科学》 2019年6期
  • 摘要:
    现代高速公路建设在我国社会经济、科技、网络等多元发展的态势背景下日新月异,作为建设高速公路的重要支持系统,机电通信的作用非常巨大,在某种程度上大大提升了高速公路的建设与运营效率。因此,加强对这一系统在新技术应用方面的研究具有很重要的实践意义。机电通信系统在整个高速公路中的收费站、监控点都有专门设置,为高速公路提供了便捷的服务和交通作用。本文主要对该方面的新技术进行了研究,希望为以后同行研究提供一定的借鉴、参考依据。
  • 基于ADAMS的道路养护车侧翻稳定性实验结果研究 下载:62 浏览:426
  • 马学尧 《数据与科学》 2019年6期
  • 摘要:
    在汽车使用过程中为了确保行驶安全在车辆出场之前需要借用模型来模拟车辆的行驶状态用以模拟其在不同环境中的工作状态。侧翻对于车辆行驶安全有非常严重的影响,在车辆出厂之前针对侧翻有相应的预防措施,为了更好的提高防止车辆侧翻的控制能力,需要车辆形态设计人员利用ADAMS对车辆侧翻过程进行模拟,通过对模拟的数据进行分析总结,提出能够防止车辆出现侧翻的相关建议,以提高车辆整体行驶安全。
  • 文本分类研究综述 下载:64 浏览:426
  • 汪岿 刘柏嵩 《数据与科学》 2019年6期
  • 摘要:
    在大数据时代,网络上的文本数据日益增长。采用文本分类技术对海量数据进行科学地组织和管理显得尤为重要。文本分类算法的研究起源于上个世纪50年代,一直受到科研人员的广泛关注。本文围绕文本分类的关键技术和基本流程进行重点阐述,主要包括文本预处理、词和文本的分布式表示、特征降维、分类算法等多个模块。其中详细分析了几种分类模型与分类方法,如深度学习、迁移学习、强化学习等等。此外,本文简单介绍了文本分类的评价指标与应用场景,并对当前面临的挑战及未来的发展趋势进行总结、预测。
  • 一种基于应用历史记录的Kubernetes调度算法 下载:67 浏览:388
  • 何龙 刘晓洁 《数据与科学》 2019年6期
  • 摘要:
    现有Kubernetes的资源调度算法在考虑节点资源平衡的打分阶段,以待调度Pod的资源申请量为依据计算cpu和内存的平衡程度,在应用实际运行中,如果应用表现出的cpu和内存资源的消耗与部署时配置文件中的资源申请量差距较大,那么就可能出现该节点的资源利用不平衡的现象,容易形成某种资源的瓶颈,导致木桶效应的出现。文章提出基于应用历史记录的调度算法,通过监控各Pod对资源的使用情况并记录下来,在非第一次部署或者动态扩容的情况下,在调度器打分时以Pod的实际使用情况作为指导,消除以经验配置yaml文件带来的不确定性而可能导致的资源浪费。该算法对于提升节点资源均衡程度,减少集群因为木桶效应带来的资源浪费相比于现有算法有一定提升。
  • 基于文件特征的加密型勒索软件检测方法 下载:61 浏览:429
  • 徐兵1 刘晓洁2 李帅1 《数据与科学》 2019年5期
  • 摘要:
    目前检测新的勒索软件主要采用动态检测的方法,而常用的动态检测方法是设置陷阱文件并实时检测其指纹变化或者实时监控文件系统操作。然而,上述方法不能很好的区分针对该文件的操作是勒索软件的操作还是其他正常操作。针对此问题,本文提出了一种基于文件特征的加密型勒索软件动态检测方法,通过提取自定义文件的信息熵、文件类型头标识等特征来进行检测,通过本文的方法定量计算出当前系统所受勒索软件的威胁程度,从而判断样本是否是勒索软件样本。
  • 区块链在数据流通中的应用 下载:86 浏览:380
  • 闫树卿 苏德 魏凯 《数据与科学》 2019年5期
  • 摘要:
    大数据的流通是创造数据价值的关键一环,然而目前数据流通面临着诸多问题。区块链是一种分布式账本技术,具有去中心化和不可篡改特性,可以解决数据流通过程中的一些痛点问题。介绍了区块链技术的特性,阐述了利用区块链改造授权存证环节、进行数据溯源和实现智能合约的主要思路,梳理了实现数据流通的整体架构。在此基础上,给出了国外利用区块链进行数据流通的应用实例,并介绍了一些其他的数据流通新技术。
  • 基于文件特征的加密型勒索软件检测方法 下载:68 浏览:351
  • 徐兵1 刘晓洁2 李帅1 《数据与科学》 2019年5期
  • 摘要:
    目前检测新的勒索软件主要采用动态检测的方法,而常用的动态检测方法是设置陷阱文件并实时检测其指纹变化或者实时监控文件系统操作。然而,上述方法不能很好的区分针对该文件的操作是勒索软件的操作还是其他正常操作。针对此问题,本文提出了一种基于文件特征的加密型勒索软件动态检测方法,通过提取自定义文件的信息熵、文件类型头标识等特征来进行检测,通过本文的方法定量计算出当前系统所受勒索软件的威胁程度,从而判断样本是否是勒索软件样本。
  • 一种基于平衡二叉树的CDP数据备份及重构方法 下载:60 浏览:352
  • 李毅飞1 杨进2 《数据与科学》 2019年5期
  • 摘要:
    当前较为流行的块级持续数据保护(CDP)系统在远程恢复备份数据的过程中,在数据重构时需要遍历所有元数据记录,从而造成了巨大时间浪费。针对上述现有方法存在的问题,为加快恢复速度,本文提出了一种基于平衡二叉树的备份数据及重构方法,此方法在备份过程中通过平衡二叉树对元数据记录进行处理,并通过位图文件来标记某个数据块是否发生过变化。在数据重构时通过平衡二叉树与位图文件处理后的元数据记录,可快速定位数据重构时刻数据块变化的位置,避免了遍历所有元数据记录,从而降低了数据重构时间。
  • 基于光纤通信的高校实验室信息管理系统研究 下载:47 浏览:455
  • 刘瑾 《数据与科学》 2019年5期
  • 摘要:
    实验室是大多数高校中必不可缺少的基本构成单元,科学合理的实验室信息管理系统能够有效提升实验室的管理水平和效益,为此提出了光纤通信的高校实验室信息管理系统研究。从硬件与软件两个方面对高校实验室信息管理系统进行设计,硬件主要利用光纤构建出通信网络,而软件设计主要借助硬件实现管理员功能、教师功能以及学生功能,经过对该信息管理系统的测试确定该实验室信息管理系统具有较强的实用性,实现了实验室数据安全共享。
  • 浅谈IP技术在电视台播出中的应用 下载:63 浏览:347
  • 王小鹏 《数据与科学》 2019年4期
  • 摘要:
    当前,超高清技术不断普及,对电视台节目的未来发展提出了全新的挑战,特别是不断增加了网络带宽的基础需求。未来广电行业的发展,必定会以IP技术的持续完善为依托。本文在分析当前电视制播系统中信号传输网络的基础上,阐述了IP技术的发展趋势,最后探讨了电视系统IP化的可行性,以及在具体应用当中的优点与需要注意的问题。
  • 基于贝叶斯新型深度学习超参数优化的研究 下载:61 浏览:253
  • 朱汇龙1,2 刘晓燕1 刘瑶2 《数据与科学》 2019年4期
  • 摘要:
    一种新的贝叶斯优化的Python框架被称为GPflow Opt。这个包是基于流行的GPflow库,主要用于高斯过程,利用了Tensor Flow的优点包括自动微分,贝叶斯优化的并行处理和GPU计算。设计目标是关注于一个易于扩展的框架,使用自定义采集功能和模型。这个框架经过了完全的测试和文档化,并且提供了可伸缩性。本文是对贝叶斯优化算法进行改进,有效解决传统贝叶斯优化算法耗时长,性能波动大的缺陷。首先,通过拉丁超立方实验设计方法,生成贝叶斯优化中建立函数模型所需的初始点,提高有效评估点的生成率;其次,通过使用改进的高斯核函数和获取函数提高贝叶斯优化的效果。最后,在计算目标函数时合理选用部分数据,并在计算过程中使用并行计算的方法,加速整个优化过程。建立上述改进贝叶斯优化算法的实例,仿真结果表明该方法优化效率高,优化结果明显改善。
  • 基于用户信任的协同推荐算法研究与分析 下载:74 浏览:347
  • 徐吉1 李小波2 许浩2 《数据与科学》 2019年4期
  • 摘要:
    协同过滤算法一般根据用户的评价信息来推测用户的喜好,但受到数据稀疏问题的影响,许多时候无法得到较为理想的推荐结果;除此之外,一般协同推荐算法忽略了用户兴趣的动态变化;考虑到传统协同过滤算法存在上述问题,本文进行了研究,并提出了改进后的协同过滤推荐算法。整个算法的具体执行过程如下所示:第一步是根据用户偏好构建一个兴趣迁移模型,然后依据具体的评分时间对多个项目评分进行有速度差异的衰减,衰减完成之后得到项目评分矩阵,并将其应用到相似度的计算中;采用这种方式能够有效地解决用户兴趣变化引起的、推荐结果准确性降低的问题。然后是构建一个合适的用户信任度模型,根据T-采用率、可信度来对用户的信任度进行计算。最后将得到的信任度与基于时间的相似度进行线性组合,依据其权重大小进行最近邻选择与项目评分,并通过实验的方式,证明算法Improvement-CF能够有效提升推荐结果的准确性。
  • 一种云环境下多目标优化虚拟机调度算法 下载:61 浏览:241
  • 陈佳 刘晓洁 《数据与科学》 2019年4期
  • 摘要:
    在云环境中,虚拟机调度一直是学者们研究的热点。一些传统的虚拟机调度方式大多使用先到先得、轮转、最早完成时间等算法,这些分配方式难以保证资源分配的公平性和有效性,容易造成负载不均衡、优化目标单一等问题。在虚拟机调度的问题上目前通常采用启发式算法来获取近似最优解,根据各个节点的性能和实际应用从整体进行资源分配,实现多目标优化。因此,结合启发式算法,根据SLA违背率、能源消耗,负载均衡三个因素设计了多目标优化函数,基于改进的模拟退火算法提出了一种多目标优化虚拟机调度算法。该算法中,用首次适配方法产生初始解,具备较好的适应能力,采用组合温度衰减函数既加快了算法前期的全局最优解邻域的搜索速度,又保证了后期局部最优解的搜索质量,在产生邻居解时通过并行模式在每次迭代中分别采用倒置和互换操作来获取两个解,增大了解空间。仿真实验证明,提出的算法和模拟退火算法以及爬山算法对比,在满足服务等级协议,提高整体资源使用率,平衡主机负载和减少能源消耗这几个方面有一定改善。
  • 电信运营商5G技术发展及应用研究 下载:48 浏览:421
  • 成静静 《数据与科学》 2019年3期
  • 摘要:
    随着互联网领域云计算大数据新技术的飞速发展,移动通信也迎来了万物互联的5G时代。5G作为改变社会的通用技术,已上升为各国国家战略。本文分析了中国电信运营商的5G发展情况,详细研究了5G的四大关键技术及八大关键指标,5G技术对各行业的九大典型应用场景提供有效网络支撑。
加入编委加入审稿人
数据与科学  期刊指标
出版年份 2018-2025
发文量 671
访问量 85621
下载量 19862
总被引次数 328
影响因子 0.627
为你推荐