PDF下载
利用准私密社交网络文本数据检测抑郁用户的可行性分析

刘德喜1,2 邱家洪1,2 万常选1,2 刘喜平1,2 钟敏娟1,2 郭海峰3 邓松4

1.江西财经大学信息管理学院;2.江西财经大学江西省高校数据与知识工程重点实验室;3.江西财经大学学生工作处;4.江西财经大学软件与通信工程学院

摘要: 社交媒体的发展为抑郁用户的检测提供了一条新的途径。已有的相关研究通常是利用用户在Twitter、微博等社交网络平台上的用户行为数据或公开发表的文本内容,较少有利用微信朋友圈、QQ空间这种相对比较私密的社交网络数据。直观地,这类准私密社交网络数据更能反映用户的心理健康状况。该文主要讨论利用准私密社交网络文本数据检测抑郁用户的可行性,包括训练样本的选择、特征量化方法、检测模型选择和不同文本特征下的模型分类效果等。实验表明,采用平衡高低分组的方法选择样本比非平衡高低分组样本和离散化的高低分组样本训练的分类器要好;利用Z-score标准化的特征量化方法比直接使用频次或归一化频率要好;随机梯度下降模型SGD较支持向量机SVM等其他用于对比的分类模型要好。实验还发现,相对于词袋、词向量等文本特征,主题特征有较好的效果,可以使社交网络用户抑郁检测模型的F值达到0.753,而对抑郁用户的检测精度达到0.813。
关键词: 准私密社交网络文本;抑郁用户检测;可行性分析
DOI:
基金资助:
文章地址: