基于小波分析的特征提取文本分类方法研究
1.延边大学计算机科学与技术学院智能信息处理研究室;2.延边大学计算机科学与技术学院
摘要: 该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。
关键词:
压缩;小波分析;TF-IDF;KNN;分类正确率;压缩感知;
压缩;小波分析;TF-IDF;KNN;分类正确率;压缩感知