请选择 目标期刊

基于遥感影像和决策树算法的土壤制图 下载:76 浏览:476

韩浩武 许伟 黄魏 陈荣 周紫燕 《中国土壤》 2019年8期

摘要:
传统土壤信息获取方法已经无法完全满足当前各领域对土壤数据的需求,如何结合新的技术提高土壤普查效率,获取高精度土壤图成为了现阶段的研究重点。本研究综合利用高分二号遥感影像提取的遥感光谱指数以及DEM数据提取的地形因子,通过决策树算法进行数据挖掘,获取各土壤类型的土壤—环境规则,然后利用SoLIM结合土壤—环境规则进行推理制图,获得研究区的土壤类型分布图。结果表明,预测土壤图总体精度为88%,高于传统土壤图的精度72%,且在三种不同的采样方式(均匀采样、横截面采样和主观采样)下土壤预测精度分别为89%、88%、86%,均高于传统土壤图。这说明,预测土壤图比传统土壤图更能反映土壤类型空间差异,且预测土壤图在表达土壤类型整体空间分布信息的同时也可捕捉到土壤类型与地貌类型的耦合关系。

数据挖掘技术在图书馆个性化信息服务中的研究 下载:68 浏览:384

赵成嵘 《国际科技论坛》 2020年9期

摘要:
图书馆数据量每年成几何量级增加,如何让读者从海量信息资源中快速获取所需的数据成为每个图书馆面临的问题。数据挖掘技术的产生,通过分析读者使用数字图书馆的习惯,个性化推送相关信息资源服务,极大提高图书馆信息服务质量和水平,提高读者使用图书馆的满意度。

基于高斯混合模型的现代汉语构式成分自动标注方法 下载:47 浏览:341

黄海斌1 常宝宝2 詹卫东1,2,3 《中文研究》 2020年3期

摘要:
现代汉语构式成分自动标注作为文本自动标注任务之一,其最大的困难在于,当不存在标注语料作为训练数据时,如何从生语料中挖掘不同类型的构式成分相关的知识并进行标注,特别是面对构式序列在句中的边界难以判断的情况。该文试图借助高斯混合模型聚类方法,结合句中每一个字的位置特征与构式形式本身的语言学特征,融合正则表达式匹配结果信息,挖掘句子中的构式实例序列,并对构式内部成分进行自动标注。相较于仅基于正则表达式匹配和词性匹配的自动标注结果,该方法的F1分别至少提高了17.9%(半凝固型构式)、19.3%(短语型构式)、14.9%(复句型构式)。

大数据挖掘技术在光伏发电功率预测中的研究与应用 下载:92 浏览:508

王鸿玺 李飞 张琳 杨鹏 陶鹏 李翀 徐建云 《中国电力技术》 2018年7期

摘要:
利用大数据挖掘技术对光伏发电功率数据进行建模,并以偏相关分析法对光伏系统发电功率与各个影响因子间的相关性进行分析,选取偏相关系数最为显著的影响因子作为输入样本,综合大数据挖掘技术中混沌神经网络(CNN)、支持向量机(SVM)、多项式回归与鲁棒平滑等多种算法的优点,建立了以混沌粒子群算法优化权重的组合预测模型,并利用该模型对某光伏系统的发电功率进行预测,验证了模型的有效性和精确性。

基于数据挖掘探讨小儿疫病组方用药规律 下载:56 浏览:363

季小钰1 柳莺南1 宋安然1 阎兆君2 《中国儿科杂志》 2020年10期

摘要:
目的运用数据挖掘技术探讨温病古籍中治疗小儿疫病的组方及用药规律。方法检索查阅温病古籍,选取治疗小儿疫病的方剂纳入Excel数据库,运用SPSS 25.0与SPSS Modeler 18.0软件分别进行描述性分析、聚类分析、因子分析及关联分析。结果本研究共纳入41首方剂、药物138味。治疗小儿疫病内服方剂中使用频数≥3次的38味药物,居前6位的依次是甘草、黄芩、麻黄、麝香、白芍、朱砂,药性以寒凉为主,药味以辛、苦、甘为主,归经以肺、脾、胃、心、肝为主,按药物功效分为13类,以清热药、解表药、补虚药为主。外用方剂中使用频次≥2次的药物有升麻、甘草、大黄、黄柏。关联分析与聚类分析共得到26条关联规则、4个聚类方,因子分析不理想。结论通过研究整理温病古籍,分析认为治疗小儿疫病以清热解表、宣降肺气为主,兼顾益气健脾,传变入里者佐以息风安神,用药多选用寒凉药物以及辛散之品,结果与中医学理论及现代药理学研究相契合,以期为小儿疫病不同发病阶段选方用药提供参考和借鉴。

基于数据挖掘的用户行为分析研究 下载:53 浏览:369

金琳 《电子商务进展》 2020年11期

摘要:
伴随我国网络信息化技术不断创新,"数据挖掘"作为数据分析、发展趋势及创新手段,其重要性不言而喻。通过近年来研究发现,"数据挖掘"应用的科学性与优化性对数据质量提升、应用效率提高、误差减低等影响颇大。本次研究将基于数据挖掘的用户行为进行分析研究,为下一步工作开展提供依据参考。

人工智能与数据挖掘技术在金融市场中的应用 下载:55 浏览:366

王娟1.2 姚雪筠2.3 《电子商务进展》 2020年4期

摘要:
运用人工智能技术是为了寻找能够适应环境变化的机制,例如能够排除不合理解决方案的机制。如今,人工智能技术在医学,游戏,运输和重工业等领域已有了广泛应用。本文主要研究的是一个跨学科问题——人工智能与金融的融合。通过简要介绍数据挖掘技术,专家系统和基于主体的计算智能,并指定用这些技术来解决金融方面的问题,以便更深入地了解智能系统在金融市场上的潜在用途。

基于数据挖掘技术的高职院校财务管理风险管控研究 下载:88 浏览:454

张国安 《交叉科学研究》 2019年5期

摘要:
为了能够提高高职院校财务管理风险管控水平,将数据挖掘技术应用于高职院校财务管理风险的预测。在分析高职院校财务管理风险根源的基础上,构建了基于数据挖掘技术的高职院校财务管理风险预测模型,同时设计了数据挖掘模型的算法流程。以10个高职学校为研究对象进行了实证研究,研究结果表明所构建的理论模型能够有效地进行高职院校财务管理风险预测,从而能够根据预测结果确定有效的财务管理风险管控措施。

基于大数据的高校智慧校园学生综合测评系统设计与研究 下载:44 浏览:366

茆灵铖 谢桂芳 邵周伟 时海茹 蒋秀莲 《软件工程研究》 2020年11期

摘要:
当前,信息化正面临着一个全新的阶段,即以数据的深度挖掘和整合应用为核心的智慧化阶段,智慧校园已成为时下高校信息化建设的重要内容。分析高校信息化建设现状和Hadoop、Spark等大数据技术框架,并重点从数据存储层、核心业务层和信息展示层对智慧校园学生综合测评系统进行分析与设计,为大数据技术与智慧校园的深度融合提供方案。

基于数据挖掘的物流成本管理模型研究 下载:53 浏览:362

王妍妍 《电子商务进展》 2018年7期

摘要:
降低成本是增强第三方物流企业竞争力的重要途径。本文采用数据挖掘技术建立物流成本管理模型,分析物流成本数据中隐含的有用信息。该模型首先引入聚类分析方法将物流成本依据自身特征分成若干簇。再引入关联规则分析方法挖掘物流成本数据之间的关联规则,形成物流成本管理决策知识库。通过挖掘物流成本数据中隐含的关键信息,可以有效管理物流成本。

大数据技术在通信运营商异网获客系统的应用 下载:54 浏览:397

谈俊林 《软件工程研究》 2020年2期

摘要:
电信运营商拥有着庞大的客户群体、海量的数据资源,如何挖掘大数据价值,精准把握客户需求,将成为运营商保持行业领先的关键。为吸引更多优质异网用户在携号转网过程中携入,本次研究通过大数据技术,借助DPI[1,2]解析信息构建异网号码池,运用逻辑回归、决策树、boosting算法[3]等原理搭建转网倾向评估模型,最后通过客户画像、异网策反目标用户分群[4],并配置针对性营销策略,构建起一个较为完善的"异网获客系统",提升运营商在携号转网过程中的客户经营服务能力。

一种基于邻接矩阵的频繁项集挖掘算法 下载:74 浏览:337

廖纪勇 吴晟 刘爱莲 《数据与科学》 2020年12期

摘要:
针对Apriori算法存在反复扫描数据库、内存消耗大、运行效率低效等固有缺陷,提出了一种基于邻接矩阵的频繁项集挖掘算法。在该算法中,将事务数据集转换为邻接矩阵,通过遍历邻接矩阵,可以直接从矩阵中挖掘得出频繁1-项集和频繁2-项集,并且该过程不会生成候选项集,从而减少了遍历的空间规模。最后使用标准数据集进行验证测试,实验结果表明,改进后的算法比传统的Apriori算法具有更好的性能,在保证挖掘结果的同时还有效地提高了频繁项集的挖掘效率。

基于支持向量机的食品安全抽检数据分析方法 下载:62 浏览:472

游清顺1 王建新1 张秀宇2 罗曦1 《软件工程研究》 2019年4期

摘要:
本文通过实验对比了逻辑回归、决策树、人工神经网络和支持向量机等方法在分析抽检数据中的表现。结果表明,支持向量机的预测准确率最高。该方法及相应软件系统能够为未来的抽检计划制定提供决策依据,在有限的抽检成本和时间花费的条件限制下,能更多地暴露食品安全中的问题,从而提升食品安全和食品质量。

关联规则算法在医疗大数据中的应用探索 下载:66 浏览:472

李强 陈东涛 罗先录 《软件工程研究》 2019年2期

摘要:
随着中国互联网越来越快的发展,互联网+、大数据和人工智能技术等最新科技技术也越来越多的渗透到医疗领域,对于提升多种疾病的筛查和诊断效率作用明显,而大数据处理技术上仍然面对着许多难题。本课题针对智慧医疗发展的难点之一,将大数据处理技术和医疗海量数据相结合,应用Apriori关联规则算法在医疗信息系统中海量医疗数据中的应用,发现疾病与其他疾病之间的联系,从而为人们的健康预警及医疗机构对疾病的诊断提供科学依据参考,本文实验数据以心肌炎和胃癌为例,发现与病症相关性强的病因。

基于大数据技术的电信客户流失预测模型研究及应用 下载:50 浏览:392

许乃利 《信息通信与技术》 2018年3期

摘要:
为减少用户流失,提高用户保有率,文章介绍一种基于智慧运营平台,将大数据技术和数据挖掘技术相结合,对电信客户流失进行预测的模型。该模型利用大数据技术处理用户离网前的海量数据信息,分析流失用户特征,建立用户流失预测,提前锁定流失风险较高的用户,有针对性地制定维挽策略,精准开展维系挽留活动,能够有效降低用户离网率。

基于OLAP的道路交通事故影响因素分析 下载:79 浏览:487

惠宝锋 冯桂莲 王咏宁 《软件工程研究》 2018年11期

摘要:
本文通过数据挖掘相关基础进行数据库搭建,选取2002—2016年数据进行OLAP分析,通过数据切片及数据向下钻取,将二维数据转换成三维数据进行深度剖析,结果显示全国道路交通事故影响因素主要集中在机动车超速行驶及逆向行驶中,其中驾驶人行为尤为突出。在Eviews软件中对数据进行预测分析发现道路交通事故存在非线性关系,并且预测了未来三年的道路交通事故数量及伤亡数量,数据显示出道路交通事故呈逐年下降趋势。

线性回归和随机森林算法融合在餐饮客流量的预测 下载:77 浏览:481

杨森彬 《软件工程研究》 2018年11期

摘要:
数据挖掘技术运用于餐饮行业具有一定的社会价值,通过预测餐饮行业客流量,根据客流量多少餐厅合理为顾客准备用餐,有利于提升顾客用餐体验,提高餐饮质量的同时让餐饮行业更高效运作。本文通过研究线性回归算法与随机森林算法理论,提出将线性回归算法与随机森林算法融合的思想,将其应用在餐厅顾客回访数量预测,并通过实验证明该思路的合理性和可实施性。通过实验对比,算法融合思路比线性回归算法准确率提高了约3.004%,比随机森林算法提高了约2.022%。比以往大部分研究取得更优的预测效果,为数据挖掘技术在餐饮行业的应用提供了新的思路。

我国出口国内增加值驱动因素的影响效应数据挖掘研究 下载:35 浏览:236

邢光远 冯宗宪 《当代管理》 2018年12期

摘要:
本文在相关研究以及欧盟第7框架计划项目支持编制的世界投入产出表(WIOD)的基础上,完成不同国家1996到2011年出口国内增加值变化率Va和出口总额变化率Vs的测算。基于EMD数据分解我国Vs和Va的年增长率发现,Va的趋势RES就是Vs的IMF3分量,揭示出口增加值的增长速度由开始加快在2004年达到高峰后开始回落,呈现偏倒U型特征;Va的IMF1和IMF2分量与Vs的IMF1和IMF2分量变化态势完全一致。借助引力模型测算发现,Vs IMF1和GDP直接关联d I的相关系数为0.652,Vs IMF2和贸易成本变化率的相关系数为-0.447,给出Va的IMF1、IMF2分量的驱动因素分别是GDP和贸易成本。研究结论对于准确识别我国出口国内增加值驱动因素及其效应提供了支撑技术和决策依据。

基于XGBoost的信用风险分析的研究 下载:87 浏览:500

赵天傲 郑山红 李万龙 刘凯 《软件工程研究》 2018年8期

摘要:
在大数据时代如何利用数据挖掘处理海量数据从而对信用风险进行预测分析成为了当下非常重要的问题,本文运用XGBoost算法建立信用风险分析模型,运用栅格搜索等方法调优XGBoost参数,基于以AUC、准确率、ROC曲线等评价指标,与决策树、GBDT、支持向量机等模型进行对比分析,基于德国信用数据集验证了该模型的有效性及高效性。

考虑布线资源松弛的X结构Steiner最小树算法 下载:46 浏览:343

汤浩1,2 刘耿耿1,2,3 郭文忠1,2,3 陈国龙1,2 《人工智能研究》 2020年10期

摘要:
为了进一步考虑X结构,并充分利用障碍内可用布线资源,文中提出考虑布线资源松弛的X结构Steiner最小树算法.为了能够求解离散问题,在粒子的更新操作中引入交叉算子和变异算子.通过构建查找表,为整个算法流程提供快速的信息查询.提出角点选取策略,通过引入一些障碍角点,使粒子满足约束.最后构建精炼策略,进一步提高最终布线树的质量.实验表明,文中算法充分利用障碍内可用布线资源,有效缩短总布线长度,取得较佳的总布线长度.
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享