请选择 目标期刊

在线评论在图书选题策划中的应用 下载:56 浏览:391

彭世豪 《中国新闻传播》 2019年10期

摘要:
在线评论不仅可以作为消费者了解和购买图书的参考依据,还能成为编辑选题策划重要的信息来源,本文基于当当网文学类图书评论,通过Word2vec技术和K-means聚类方法构建了文学类图书特征词库,利用该词库对图书评论进行挖掘,分析不同销量排名的文学类图书在内容表现上的差异,为选题策划提供参考。

基于ALS模型协同过滤推荐算法的研究 下载:80 浏览:323

舒珏 淋吴晟 《数据与科学》 2020年6期

摘要:
针对协同过滤算法存在着数据稀疏性、准确性以及可扩展性问题,提出了一种结合Word2Vec词向量模型和LSH局部敏感哈希的矩阵分解推荐算法。首先通过Word2Vec模型高速将词的相似性转换为向量之间的相似性,然后基于改进的LSH局部敏感哈希高速计算项目向量之间的相似矩阵,最后结合用户-项目原评分矩阵计算出未评分项目的预评分进行数据的填充,同时在ALS矩阵分解阶段加入相似性,以减少隐含特征因子信息的丢失。实验结果表明,改进的算法比传统的协同过滤推荐算法的MAE值低,具有更优的性能。

融合CNN和LDA的短文本分类研究 下载:86 浏览:487

张小川 余林峰 桑瑞婷 张宜浩 《软件工程研究》 2018年9期

摘要:
应用卷积神经网络分类文本是自然语言处理领域的研究热点,针对神经网络输入矩阵只提取词粒度层面的词向量矩阵,忽略了文本粒度层面整体语义特征的表达,导致文本特征表示不充分,影响分类准确度的问题。本文提出一种结合word2vec和LDA主题模型的文本表示矩阵,结合词义特征和语义特征,输入卷积神经网络进行文本分类,以丰富池化层特征,达到精确分类的效果。对本文提出模型进行文本分类实验,结果表明,本文算法相比传统特征输入的卷积神经网络文本分类,在F度量值上取得一定程度的提升。

一种改进的K均值微博热点话题发现方法 下载:65 浏览:237

何诺 马苗苗 《数据与科学》 2019年1期

摘要:
本文对于K均值聚类算法应用在大量微博数据集中聚类效率低,正确性不高的问题,提出了一种改进的K均值微博热点话题发现方法。在对微博特有属性的研究基础上,利用微博转发关系解决微博内容碎片化导致的聚类准确性及效率较低的问题;实验结果表明本文提出的改进的K均值聚类算法比传统的K均值热点话题发现,准确率提升了11.3%,聚类比较次数提升了27.5%。

基于词嵌入技术的文本表示研究现状综述 下载:70 浏览:498

刘胜杰 许亮 《计算机研究与应用》 2020年3期

摘要:
文本的表示是自然语言处理领域重要的工作,如何更好地表示文本语义是自然语言处理领域实际应用的重要基石。通过训练得到的词嵌入向量表示,可以认为其即代表单词本身及其含义。单词在不同语境下的含义不一样,不同的语境下涉及到一词多义问题,如何准确表示词嵌入向量以适应不同的语境也是目前研究的热点。目前词嵌入技术还处于初级阶段,还有很多问题值得深入研究。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享