请选择 目标期刊

基于小波分析的特征提取文本分类方法研究 下载:61 浏览:331

朱晋1 怀丽波1 崔荣一1 尹慧2 《中文研究》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

基于BiLSTM-CRF模型的汉语否定信息识别 下载:21 浏览:451

朱晋1 怀丽波1 崔荣一1 尹慧2 《当代中文学刊》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

基于小波分析的特征提取文本分类方法研究 下载:43 浏览:261

朱晋1 怀丽波1 崔荣一1 尹慧2 《当代中文学刊》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

基于卫星装配工艺的短文本聚类研究 下载:42 浏览:361

崔晴洋1 梁小峰2 倪静1 李帅2 张生1 仲梁维1 《软件工程研究》 2020年10期

摘要:
为了实现机械手对卫星的自动装配,保证在装配过程中机械手能明确每一步的操作类型。本文主要基于对人工作业的卫星装配工艺规程文件进行文本挖掘,以装配工步内容作为短文本进行操作类型的分类。利用自然语言处理中常用的TF-IDF算法与TextRank算法提取关键字,结合基于装配工艺术语的分级加权方法,构建三种不同的词向量模型与词袋空间。最后使用K-means聚类算法,分别对上述三种方案下的聚类结果进行比较与评估。结果表明,基于装配技术术语的分级加权方案表现最好,平均准确率、召回率、F值分别为88.67%、88.71%、88.66%。基于装配技术术语的短文本聚类方法不仅能自动对复杂的操作类型进行自动分类,大大减少了人工干预,而且极大地提升了分类的准确率。

基于文本向量的php-webshell检测方法 下载:74 浏览:293

张贺威 刘晓洁 《数据与科学》 2019年10期

摘要:
常见的php-webshell检测方法主要有静态检测方法和动态检测方法两类,相较于动态检测方法,静态检测方法以其占用资源少,检测周期短,效率高的优点,获得了更为广泛的应用,但是传统的基于正则匹配的静态检测方法,不能有效识别混淆后的php-webshell脚本,也不能有效识别从未出现过的php-webshell脚本,新兴的使用机器学习算法的静态检测方法又有着特征普适性差的缺点。针对以上问题,提出了一种基于文本向量的php-webshell检测方法,使用n-gram算法和TF-IDF算法将php脚本执行过程中产生的操作码序列转化为文本向量,以文本向量作为输入特征,使用极限梯度提升算法XGBoost对php脚本分类,通过判断分类结果,实现phpwebshell检测,实验结果表明,所提方法能有效地检测php-webshell,提高了php-webshell静态检测方法的准确率。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享