请选择 目标期刊

基于文本挖掘的电商评论情感分析 下载:68 浏览:390

张敏 《国际科技论坛》 2020年4期

摘要:
本文以京东商城某品牌热水器的购买用户文本评价数据为基础,通过构建LDA主题模型进行主题的提取,实现对其倾向性判断以及所隐藏信息的挖掘与分析,为生产商提供指导性建议。

基于粗糙集和多通道词向量的中文文本情感特征分析 下载:42 浏览:365

陈波1 谢珺1 苗夺谦2 王雨竹1 续欣莹3 《中文研究》 2020年10期

摘要:
粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法。利用粗糙集决策表对整个语料库进行情感词特征建模,采用Johnson粗糙集属性约简算法对决策表进行化简,保留最小的文本情感词特征属性集,之后再对该集合中的所有情感特征词进行词嵌入表示,最后用逻辑回归分类器验证RS-WvGv方法的有效性。另外,该文还定义了情感词特征属性集覆盖力,用于表示文本情感词特征属性集合对语料库的覆盖能力。最后,在实验对比的过程中,用统计检验进一步验证了该方法的有效性。

基于小波分析的特征提取文本分类方法研究 下载:61 浏览:327

朱晋1 怀丽波1 崔荣一1 尹慧2 《中文研究》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

面向中文网络评论情感分类的集成学习框架 下载:25 浏览:226

黄佳锋1 薛云1,2 卢昕1 刘志煌1 吴威1 黄英仁1 李万理1 陈鑫1,3 《中文研究》 2018年4期

摘要:
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。

哈萨克语句法分析辅助特征提取研究 下载:63 浏览:276

陈雪古丽拉·阿东别克 《中文研究》 2018年2期

摘要:
在哈萨克语句法分析中,该文用平均感知器算法训练句法分析模型,用柱搜索算法进行解码,可以快速准确地对哈萨克语句子进行短语结构句法分析。在解析句子过程中,构建了一个双向LSTM模型,利用它提取句子中每个单词之间组成结构的信息,以预测每个单词在句法树中的句法组成部分,然后将结果作为辅助前瞻特征传递给句法分析过程。实验证明,此方法与基线模型相比,在准确率和召回率上均有提高。

基于小波分析的特征提取文本分类方法研究 下载:43 浏览:258

朱晋1 怀丽波1 崔荣一1 尹慧2 《当代中文学刊》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

文本可读性的自动分析研究综述 下载:51 浏览:280

吴思远1,2 蔡建永2,3 于东1 江新2 《当代中文学刊》 2018年11期

摘要:
文本可读性问题最初由教育学家提出,初衷是辅助教师为语言学习者推荐适合其阅读水平的文本。随着计算机技术的发展及网页文本的涌现,对文本进行可读性分析有了更加丰富的技术手段和应用场景。该文对可读性自动分析的相关研究进行了梳理,将可读性自动分析的方法总结为公式法、分类法和排序法三类;然后进一步介绍了可读性自动分析中的两项重要内容:文本特征的选择和数据集的使用;最后对可读性研究的发展方向进行展望。

基于深度神经网络的药物蛋白虚拟筛选 下载:38 浏览:379

周世英 李福东 姜定 《软件工程研究》 2020年12期

摘要:
药物的研发是一种投入成本高、耗费时间长且成功率较低的一种研究,为了在药物开发阶段可以快速获得潜在的化合物,针对性地提出一种基于深度神经网络的药物蛋白虚拟筛选的方法。首先从给定数据集中学习如何提取相关特征,获取配体原子和残基类型进行特征分析,快速识别活性分子和非活性分子,然后使用降维方式和K折验证等方法对药物筛选的模型进行处理,最后通过分析富集因子和AUC值验证诱饵化合物与分子蛋白的互相作用验证模型的可靠程度,实验结果表明所提出的筛选方法具有很好的可行性和有效性,有效地加快了虚拟筛选过程。

基于多源DEM的数字流域特征提取对比分析 下载:75 浏览:432

李世有 《水资源研究进展》 2019年10期

摘要:
为探讨不同DEM数据源在提取流域特征方面的优劣,本文采用HYDRO1K、SRTM3-DEM和ASTER GDEM数据,以金沙江下游干流小黄瓜园流域为研究区,详细对比了3种DEM数据源在提取流域数字特征等方面的差异。结果表明:洼地填充后,各数据的高程累积频率曲线都近似一条"S"形曲线;当DEM水平分辨率达到一定精度后,水系提取效果不会随着数据精度的提高而改善;三种DEM数据提取的子流域的平均高程相差不大,随着水平分辨率的提高,子流域平均地形起伏度和平均坡度呈增大趋势。该研究可为流域水文模拟及水资源管理等方面提供科学参考。

基于方差加权的LBP特征提取算法 下载:56 浏览:333

尹玉梅 彭艺 祁俊辉 《数据与科学》 2019年8期

摘要:
针对传统LBP特征提取算法没有考虑到区域重要性而造成的特征识别率不理想情况,提出一种基于方差加权的LBP特征提取算法。算法利用区域内的归一化方差作为该区域的权值,对由旋转不变均匀LBP算子生成的特征向量进行加权处理。实验结果表明,该算法在Brodatz纹理库中有91. 83%的特征识别率,较传统LBP算法提升14.89%,分类时间也较传统LBP算法提升36.1%;并且通过在TC14、TC12、TC10等纹理库中验证了本文算法的灰度不变性与旋转不变性,具有不错的鲁棒性。

模糊C均值聚类在光伏阵列故障样本数据识别中的应用 下载:32 浏览:330

陆灵骍 朱红路 连魏魏 戴松元 姚建曦 《发电技术与研究》 2018年6期

摘要:
光伏电站由数量庞大的光伏组件构成,因复杂的生产工艺及艰苦的工作环境,光伏系统直流侧故障频发,直接影响到光伏系统的发电效益。如何从光伏阵列的运行数据中提取有效的故障样本,并对其进行识别,是建立故障模型的重要步骤。因此提出一种基于模糊C均值(fuzzy C-means,FCM)聚类算法对故障样本进行划分及标识的方法。首先对故障条件下光伏阵列的输出特性进行分析,提取出故障特征向量(开路电压Uoc,短路电流Isc,最大工作点电压Um,最大工作点电流Im)。为排除外部激励条件对电气参数的影响,将故障特征向量统一转换至标准测试条件(standard test condition,STC)。最后根据FCM算法良好的模糊信息处理功能,对开路故障、短路故障、阴影故障、异常老化故障的样本进行聚类划分。实际运行数据证明,该方法可以精确、可靠地对光伏系统直流侧典型故障的样本进行智能聚类,并有效地描述不同故障下光伏阵列电气参数的分布特征。

基于深度学习的山东大尹格庄金矿床深部三维预测模型 下载:45 浏览:442

邓浩1,2 郑扬1陈进1,2 魏运凤1毛先成1,2 《地球科学探索》 2020年2期

摘要:
在隐伏矿体三维预测中,预测模型的准确性在很大程度上取决于找矿指标对矿化富集部位的指示性。然而,找矿指标容易受到找矿概念模型可靠性和成矿信息提取有效性限制,从而影响预测的准确性。论文以山东大尹格庄金矿隐伏矿体三维预测为例,基于深度学习方法,构建矿床深部隐伏矿体三维预测模型,旨在利用深度网络模型,学习获得对矿化具有显著指示性的找矿指标,提升三维预测的准确性。该方法将三维地质模型及其形态特征转换为适合卷积网络二维图像,采用卷积神经网络实现找矿指标的自动提取,并构建三维地质模型到矿化富集地段的定量关联。利用该方法建立了大尹格庄金矿的三维预测模型,经与几种人工建立找矿指标预测模型的对比分析,表明基于深度学习的预测模型较大地提升了预测准确性。

基于视觉的车辆异常行为检测综述 下载:53 浏览:352

黄超1,2 胡志军3 徐勇1,2 王耀威2 《人工智能研究》 2020年6期

摘要:
基于视觉的车辆异常行为检测能够快速检测交通监控视频中的车辆异常行为并报警,在提升交通执法效率,改善城市交通状况和减少交通事故率等方面具有重要作用.当前基于视觉的车辆异常行为检测已取得较大进步,但在实际应用中仍面临如缺乏数据、异常定义的不确切性、遮挡和实时性较差等问题.文中归纳总结近年来提出的基于视觉的车辆异常行为检测算法.首先,介绍当前算法中典型的行为表示特征,从监督学习和非监督学习两方面讨论现有车辆行为学习方法的优缺点.然后,根据行为建模方法将车辆异常行为检测算法分为基于模型的方法、基于重建的方法和深度学习方法,介绍和分析每类方法.最后,讨论当前算法存在的问题,并展望未来的改进方向.

基于隧道点云特征孔洞修补方法 下载:49 浏览:412

王井利 王丙达 《地球科学探索》 2019年2期

摘要:
针对隧道三维激光扫描点云的特征,设计一种基于提取轮廓线进而孔洞修复方法。该方法能够对三维激光扫描点云进行圆柱投影,利用Delaunay三角构网,提出基于隧道表面三角网的孔洞识别方法。并且通过阈值过滤标记潜在谷脊点,并在每个潜在谷脊点的局部邻域内构建紧附于潜在曲面、能反映该点局部几何特征信息的三角网格。最后根据相邻隧道轮廓相似的特点,利用相邻的管片点云对孔洞进行修复该方法能很好的修复孔洞并保留隧道结构细节,并以真实的隧道扫描数据验证算法的有效性和可靠性。

工业控制系统未知协议特征提取及异常流量检测 下载:78 浏览:513

方鼎鼎1 郑荣锋1 周安民2 《计算机研究与应用》 2019年12期

摘要:
工业控制场景为了满足自动化和机械化生产的需求,往往具有高度的周期性,因此工业控制系统的流量也具有周期性的特点,同时为了保证生产安全,工业协议基本都是私有协议。针对工业控制系统的流量研究,可以从周期特性入手,利用自然语言分析的方法,结合统计学规律与关联规则算法,提取出工业控制系统数据流中未知协议的流量特征,建立有限状态机模型,通过西门子工控实验仿真平台验证流量检测模型的有效性。

基于文献特征提取网页信息的算法研究 下载:69 浏览:485

郭培铭1,2 《计算机研究与应用》 2019年7期

摘要:
网页信息提取是计算机技术中重要的一项技术,在许多领域中得到应用,在图书馆领域尚未得到广泛的应用。通过以文献外在特征信息各自的特点为判断依据,对文献信息在网页中的自动提取进行算法实现,获得良好的结果。

草莓重量和形状图像特征提取与在线分级方法 下载:67 浏览:444

张青1 邹湘军2 林桂潮1 孙艳辉1 《建模与系统仿真》 2019年4期

摘要:
针对草莓在采后分级生产中存在分级规格不一和效率低下等问题,提出一种基于机器视觉技术的草莓重量与形状分级方法。利用阈值分割法检测草莓果实,提取果实周长和面积参数,通过多元线性回归分析建立草莓重量分级模型;提取果实的低频椭圆傅里叶系数作为形状特征参数,并对支持向量机进行训练,建立草莓形状分级模型。选用200个草莓样本进行试验,结果表明:重量分级正确率为89.5%,形状分级正确率为96.7%,平均运算时间分别为64ms和39ms。试验验证了该方法的鲁棒性和实时性。

草莓重量和形状图像特征提取与在线分级方法 下载:50 浏览:409

张青1 邹湘军2 林桂潮1 孙艳辉1 《建模与系统仿真》 2019年4期

摘要:
针对草莓在采后分级生产中存在分级规格不一和效率低下等问题,提出一种基于机器视觉技术的草莓重量与形状分级方法。利用阈值分割法检测草莓果实,提取果实周长和面积参数,通过多元线性回归分析建立草莓重量分级模型;提取果实的低频椭圆傅里叶系数作为形状特征参数,并对支持向量机进行训练,建立草莓形状分级模型。选用200个草莓样本进行试验,结果表明:重量分级正确率为89.5%,形状分级正确率为96.7%,平均运算时间分别为64ms和39ms。试验验证了该方法的鲁棒性和实时性。

基于深度学习的电网短期负荷预测方法研究 下载:82 浏览:498

吴润泽1 包正睿1 宋雪莹1 邓伟2 《电力研究》 2018年5期

摘要:
深度模型通过学习一种深层非线性网络结构以实现复杂函数逼近,具有很强的自适应感知能力。本文为了提高电力负荷预测精度,提出一种基于栈式自编码神经网络的深度学习预测方法。该方法结合自编码器和逻辑回归分类器构建一个多输入单输出预测模型,并将重构后的历史负荷、气象信息等数据输入到预测模型中,用栈式自编码器逐层学习并提取深层特征,最后在网络顶层连接逻辑回归模型进行短期负荷预测。实例分析表明,所提预测模型能够有效刻画日负荷变化规律,泛化能力较强,其预测精度达到96.2%,比支持向量回归和模糊神经网络两种浅层学习模型更高。

基于振动模态参数识别的脑电信号特征提取 下载:51 浏览:442

杨怀花 叶庆卫 《天线研究》 2021年4期

摘要:
对运动想象脑电信号的动力学模型进行了分析,将其分成两个阶段(强非线性的瞬态阶段和弱非线性的自由响应阶段),并构建了一种新的特征提取算法。首先通过起始点扫描的方式对脑电信号进行分割来获得自由响应阶段的脑电信号;然后针对自由响应阶段产生的脑电信号,引入振动多模态参数识别ITD(Ibrahim Time Domain)算法来提取特征组合成特征向量;最后利用Adaboost分类器进行自适应特征选择和分类。运用此方法对国际标准数据库The largest SCP data of Motor-Imagery中的CLA运动想象数据集进行特征提取和特征选择与分类,其平均分类准确率高达90%以上。与现有的特征提取算法相比,获得了更好的分类性能和稳定性。
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享