请选择 目标期刊

基于字词特征自注意力学习的社交媒体文本分类方法 下载:43 浏览:370

王晓莉1 叶东毅2 《人工智能研究》 2020年9期

摘要:
社交媒体文本中突出的长尾效应和过量的词典外词汇(OOV)导致严重的特征稀疏问题,影响分类模型的准确率.针对此问题,文中提出基于字词特征自注意力学习的社交媒体文本分类方法.在字级别构建全局特征,用于学习文本中各词的注意力权值分布.改进现有的多头注意力机制,降低参数规模和计算复杂度.为了更好地分析字词特征融合的作用,提出OOV词汇敏感度,用于衡量不同类型的特征受OOV词汇的影响.多组社交媒体文本分类任务的实验表明,文中方法在融合字特征和词特征方面的有效性与分类准确度均有较明显的提升.此外,OOV词汇敏感度指标的量化结果验证文中方法是可行有效的.

基于正序迭代选择策略的聚类中心自动选择方法 下载:79 浏览:396

王万良 吕闯 赵燕伟 高楠 杨小涵 张兆娟 《人工智能研究》 2019年4期

摘要:
针对密度峰值聚类算法的决策函数不能自动有效地确定聚类中心的问题,提出自动确定聚类中心的密度峰值聚类算法.首先,通过归一化处理,使决策函数中的两个变量分布均匀.然后,在确定聚类中心时,提出正序迭代选择策略,即根据聚类核心点数目的变化趋势搜索拐点,并以拐点之前的点作为聚类中心,完成聚类.最后,在UCI数据集上验证文中算法的性能,算法在未提高时间复杂度的情况下,可以对任意分布形状的数据集进行聚类,具有较好的适应性和聚类效果.

不协调广义多尺度决策系统的尺度组合 下载:71 浏览:430

吴伟志1 庄宇斌1 谭安辉1 徐优红2 《人工智能研究》 2018年12期

摘要:
针对不协调广义多尺度决策系统的知识获取问题,首先回顾广义多尺度信息系统中尺度组合的概念,给出在不同尺度组合下信息粒的表示及其相互关系.然后进一步定义在不同尺度组合下集合的下、上近似概念,给出近似集的性质.最后讨论不协调广义多尺度决策系统中的最优尺度组合的选择,并使用证据理论中的信任函数和似然函数刻画不协调广义多尺度决策系统中的最优尺度组合特征.

基于自适应PSO和混合转换策略的X结构Steiner最小树算法 下载:81 浏览:454

刘耿耿1,2 陈志盛1 郭文忠1,2,3 陈国龙1 《人工智能研究》 2018年9期

摘要:
X结构Steiner最小树(XSMT)是非曼哈顿结构总体布线算法中多端线网的最佳连接模型,属于NP难问题.文中基于混合转换策略和自适应粒子群优化算法,提出XSMT构造算法.首先设计有效的混合转换策略,扩大算法寻优空间,提高算法收敛效率.为了满足粒子编码的健全性,算法的更新方式引入带并查集策略的交叉和变异算子,同时采取自适应调整学习因子的策略,加快粒子群优化算法的收敛速度.实验表明,文中算法能得到较好的XSMT求解方案,获得多种不同拓扑的XSMTs,有利于VLSI总体布线阶段的拥挤度优化.

面向在线智慧学习的教育数据挖掘技术研究 下载:92 浏览:504

刘淇1 陈恩红1 朱天宇1 黄振亚1 吴润泽1 苏喻2 胡国平2 《人工智能研究》 2018年1期

摘要:
随着教育信息化进程的深入,学生在线学习数据得到不断积累,为数据驱动的教育评估和智能辅助教学提供良好条件.然而,已有的面向在线智慧学习的教育数据挖掘模型很难从海量、稀疏、高噪的数据中准确分析试题特征和学生学业水平,也较少考虑学生及教师的个性化需求.文中针对上述问题开展若干面向在线智慧学习的教育数据挖掘技术研究工作,以教育学习所涉及的试题、学生、教师为对象,以个性化推荐等技术同教育领域知识相结合为手段,以提高学生学业水平为目标.具体介绍用于试题分析和检索的试题文本表征模型、基于认知诊断的个性化学习资源推荐方法、针对教师的教学建议和指导等方法,以及这些技术所依托的应用平台——科大讯飞在线教育系统"智学网".最后简单讨论面向在线智慧学习的教育数据挖掘技术未来可能的研究方向.

智慧校园建设中校园百事通的设计与实现 下载:15 浏览:183

张春娥 张云峰 李瑛 《航空航天学报》 2019年6期

摘要:
在"大智移云"快速发展的时代,为了推动智慧校园的建设,设计了一款针对大学生的校园信息交互系统。本系统借助移动云平台存储和处理数据,用户通过手机等移动终端设备使用,方便大学生及时地收到校园信息和了解大学周边的生活环境,以便筛选出有用信息,据此安排自己的校园生活。从而提高大学生的生活效率,推动智慧校园的建设。

基于改进SLIQ算法及多粒度气象信息匹配的短期负荷预测 下载:71 浏览:495

李滨1 覃芳璐2 李倍存1 吴茵2 李佩杰1 《电网技术研究》 2018年2期

摘要:
短期负荷预测容易受到气象等多种因素共同作用的影响,找到关键影响因素是提高短期负荷预测精度的必要手段。电力系统海量数据包含了巨量的运行信息,为挖掘有用信息,提高数据利用效率,提出了一种基于改进SLIQ算法及多粒度气象信息匹配的短期负荷预测方法。采用改进的SLIQ决策树算法对气象负荷信息进行聚类,提取同等气象条件下决定负荷波动的关键因素。由动态灵敏度方法建立短期负荷拐点预测模型,再由熵权法选择最佳预测参考日并预测曲线拐点,并在此基础上提出多粒度气象信息匹配算法进行负荷曲线预测。通过对我国南方某地区的多季节负荷进行仿真预测,计算结果表明在任意气象条件下曲线预测精度均能满足电网要求,证明了所提方法的正确性及普适性。

水泥窑协同处置生活垃圾的燃烧特性分析优化 下载:64 浏览:462

吴敬兵 唐汉卿 胥军 《建模与系统仿真》 2020年2期

摘要:
针对传统方法难以分析掺烧生活垃圾后的水泥窑复杂燃烧特性的问题,引入数据挖掘技术,以国内某水泥厂为对象,采集相关参数数据,使用稳定性选择算法分析各参数对煤耗与NOx排量的影响系数,通过随机森林算法建立煤耗与NOx排量的数学模型,结合K-means聚类算法得出关键优化参数及其最优值。结果表明,该方法能够建立精确的煤耗与NOx排量模型,挖掘出节能减排的关键优化参数及其最优目标值。通过改善关键优化参数至最优值,能够大大降低煤耗与NOx排量,可指导水泥厂优化窑内燃烧特性。

在GPS数据挖掘中基于向量自回归的POI类型转移矩阵规律与预测 下载:65 浏览:489

李晓娟 《计算机研究与应用》 2019年3期

摘要:
近年来有关POI的数据挖掘是研究热点之一,但很少有专门针对POI类型间变化规律的研究工作。基于此,提出一种新的停留点提取方法用于从原始GPS轨迹中提取出用户的POI点,并基于所有用户的POI点得到一个POI类型转移矩阵序列,用基于向量自回归模型的POI类型转移演化算法BVAREA来学习类型转移矩阵的变化规律。并在Geolife数据集上进行实验,结果表明,BVAREA模型在MAE和RMSE指标上都优于基于AR、MA和SES模型,在MAE指标上预测性能最高可以分别提升9.23%、14.84%和14.1%。

论学术界对开源社区GitHub的贡献 下载:71 浏览:458

刘琪琪 《计算机研究与应用》 2018年12期

摘要:
GitHub是一个面向开源及私有软件项目的托管平台,每天都有成千上万的项目在上面诞生。在这些数以千万计的项目中,不仅有来自学术界,更多的是来自工业界的。运用数据挖掘技术,能够发现其中对科研工作者有帮助的信息。通过对GitHub用户信息进行分类,分析其中学术研究者、工程师以及个人用户的数量及其所占比例,挖掘出开源平台的用户使用习惯信息,了解用户使用开源平台的目的所在,从而分析出开源项目的发展趋势。

数据挖掘在上市公司财务综合评价中的应用 下载:69 浏览:416

钟烨林 《计算机研究与应用》 2018年8期

摘要:
以2016年我国互联网和相关服务上市公司52个观察样本为研究对象,首先应用因子分析法对上市公司财务评价指标体系进行降维,得到盈利能力、运营能力、成长能力和偿债能力等4个主因子,然后采用K-均值聚类方法进行分类,将样本公司分成五类,对每一类公司的优势和劣势进行比较分析,为上市公司利益相关者决策提供依据。

数据挖掘技术在医院信息处理中的应用 下载:35 浏览:398

张小叶 《数据与科学》 2025年3期

摘要:
数据挖掘技术在很多行业中都起着极其重要的作用,在医疗行业的应用亦是如此。主要是通过对数据库中的海量数据间的潜在价值分析来发现其中最有价值的数据,继而为依托数据应用的决策者提供数据上的科学支撑,以此保证决策进行的合理性。本文从数据挖掘技术在医院信息系统中管理与诊断方面的应用入手,为医院应用中的治疗与预防提供可参考的信息处理依据。

基于大数据的环境监测与预警系统研究 下载:36 浏览:392

赖泽浩 《数据与科学》 2025年1期

摘要:
环境监测与预警系统对于保护生态环境避免重大自然灾害有着显著的意义。本文通过研究大数据在环境监测和预警系统中的应用,分析其处理海量数据,快速准确预测环境变化的优势。研究方法主要使用数据挖掘和机器学习算法,构建并优化环境监测数据预处理、模型建立与预警结果的判断标准。研究结果表明,基于大数据的环境监测与预警系统能够有效处理和分析大量环境监测数据,并且能准确、快速地预测环境变化趋势,极大地提高了环境保护的效率及准确性。实验对比了传统的环境监测与预警系统,证实基于大数据的系统预测精度更高,响应速度更快。本研究的成果为环境保护,特别是环境监测与预警提供了新的理论与实践方法,对现代环保事业的发展有着十分丰富的理论指导意义和实践价值。

聚类分析及其在电力系统中的应用综述 下载:76 浏览:450

李君卫 汤亚芳 郝正航 冒国龙 姜有泉 《电力研究》 2019年7期

摘要:
随着高级测量体系(AMI)在智能电网中的大量使用,电网产生海量的样本信息数据,使用聚类分析方法可以获得详尽的电力系统运行信息。对电力系统中常用的经典型聚类方法和混合型聚类方法进行了概括,并总结了聚类结果的评价指标;对聚类分析在电力系统的负荷预测、电能质量扰动分析、孤岛检测、局部放电和需求响应等领域的应用现状进行了分析;展望了聚类分析技术在电力系统中的研究与发展前景。

一种基于数据挖掘的馈线可装容量模型分析方法 下载:81 浏览:478

郑勇1 孙明2 曹照静2 董树锋2 夏圣峰1 陈辉河3 《电力研究》 2018年4期

摘要:
馈线作为配网运行最关键的设备之一,评估馈线供电能力是保障配网运行的重要手段。本文通过引入馈线组负荷同时系数和需要系数两个参数,构建计算模型,求解馈线可装容量以评估馈线供电能力。首先,通过聚类分析和神经网络预测等方法预测馈线组负荷同时系数。然后,将馈线各负荷根据其实际接入容量情况分为饱和负荷和未饱和负荷,采用灰色预测和神经网络相结合的组合预测方法计算未饱和负荷的需要系数。最后,将预测得到的两个系数代入馈线可装容量计算模型进行求解。实际算例分析表明:所提方法的计算结果具有一定的预测趋势,充分利用了馈线载流量,并兼顾了配电网运行的可靠性,对于指导电网营销部门业扩报装工作具有重要意义。

高校教育数据挖掘的动力与高校治理改进 下载:98 浏览:509

丁国勇1、2 程晋宽2 《中国教育探索》 2018年8期

摘要:
大数据时代挖掘和利用高校教育数据的价值,有助于高校治理的改进。基于教育数据挖掘,有助于高校领导做出科学决策,有利于提高管理部门的效率,有利于改进高校师生的教学体验和学业表现。高校教育数据挖掘具有独特的技术优势和发展前景,应充分发挥高校教育数据挖掘的功能,服务大数据战略,确保高校数据挖掘的有效性,规避高校教育数据挖掘的风险,防止数据崇拜。

数据挖掘在护理不良事件管理中的应用进展 下载:11 浏览:360

丁四清1 陆晶2 秦春香3 盛江明4 王璐2 石双姣2 李雨潇2 2019年12期

摘要:
从不良事件上报、监测和预警3个方面综述了基于数据挖掘的护理不良事件管理研究,旨在为护理不良事件管理和护理实践提供参考。

基于数据挖掘的便秘患者选穴规律分析 下载:21 浏览:387

陈丽坚 萧鲲 肖明月 张翠玲 2018年12期

摘要:
利用数据挖掘技术,了解穴位按摩治疗便秘的选穴配伍规律,为便秘患者的穴位按摩提供参考依据。方法以"便秘""穴位按摩""穴位按压""穴位按揉"为关键词,从中医临床诊疗文献数据库、中国生物医学文献数据库、维普数据库、万方医学数据库等数据库中收集数据,对数据进行预处理后,进行穴位频次描述性分析和选穴规律关联分析。结果共纳入文献371篇,包含89个穴位,针对人群多为神经科、骨科和消化科的患者;最常见的选穴依次为天枢穴(18.52%)、中脘穴(10.44%)、足三里穴(10.25%)、支沟穴(6.22%)、气海穴(5.72%)、关元穴(5.47%)和大横穴(5.16%);不同基础疾病的便秘患者选穴位置不一。结论神经科、骨科和消化科便秘患者是常见的穴位按摩人群,天枢穴、中脘穴、足三里穴等是治疗便秘的常用穴位,穴位配伍治疗便秘效果较好,不同基础疾病的便秘患者应该选择不同的穴位按摩。

中国近海捕捞机动渔船航次特征数据挖掘 下载:50 浏览:324

高明远1,2 张胜茂2 汤先峰2 樊伟2 范秀梅2 伍玉梅2 朱文斌3 《中国水产学报》 2021年1期

摘要:
为加强渔船进出港管理和捕捞渔获物监管,解决信息上报中主观性大,报告信息错误、虚假报告等问题,利用北斗船位数据记录渔船出海作业的时间、位置、航速、航向等信息,通过航次特征数据挖掘,分析了港口格网、岸线点与北斗船位终端记录轨迹的空间关系,提取到2.5万余艘渔船的39.98万个航次数据,并利用船位点球面距离累加计算航程,利用船位点到岸线点距离计算平均离岸距离,分析了中国近海渔船的航次特征。结果表明:渔船出港时间集中在每日8:00—17:59,进港时间集中在每日5:00—10:59和13:00—18:59;航次特征数据受大小潮、朔望日等影响较大,可划分为1~10d、11~15d、16~21d和22~30d等航次时长段;渔船的航次时长、航程和平均离岸距离均由江苏省向北、向南降低。研究表明,利用北斗船位数据提取航次具有速度快、实时性强的特点,是渔船管理的重要信息源之一,可为渔船进出港管理提供参考。

神经源性膀胱上尿路损害风险评估工具的研制 下载:22 浏览:431

方蘅英1 梁骊敏1 蔡文智2 王凯3 2018年7期

摘要:
目的研制神经源性膀胱上尿路损害风险评估工具,以早期发现危险人群。方法调查112例神经源性膀胱患者的一般资料、病情资料、尿动力学和泌尿系影像学资料,分别建立Logistic回归和决策树模型,根据准确度和受试者工作特征曲线下面积较高的模型形成风险评估工具。结果决策树模型的准确度和受试者工作特征曲线下面积(84.8%,0.909)高于Logistic回归模型(73.2%,0.842),据此形成了包含尿道功能、性别、最大腹压、最大膀胱内压4个指标的风险评估表。结论本研究研制的神经源性膀胱上尿路损害风险评估表,为临床筛选危险人群提供了一种简便易行的工具。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享