基于决策树模型的社会稳定预警研究
卢经亿
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

卢经亿 ,. 基于决策树模型的社会稳定预警研究[J]. 社会科学研究进展,2023.6. DOI:10.12721/ccn.2023.157057.
摘要: 本文以如何衡量社会稳定,如何判断社会风险的角度出发,选取关键性的指标,从国家统计局数据库上获取数据建立社会稳定指标体系,并分析指标间的相关性和因果关系,利用RSR评价的方法对各个国家的社会稳定进行评估,建立社会稳定的早期预警模型,以决策树形式呈现,并应用在颜色革命企图推翻政权的国家或地区(本文选用缅甸)进行评估和验证, 采用可解释模型shap方法,试验表明该模型有效,建立良好。最后总结自己的工作成果,提出维护社会稳定的建议。
关键词: 社会稳定;决策树;数据分析
DOI:10.12721/ccn.2023.157057
基金资助:

1方法与模型概述

1.1采用方法

使用国家统计局数据库作为数据来源,通过数据处理训练建立社会稳定指标体系和社会稳定的早期预警模型并对结果进行分析,以提供相应的解决方案。

工作主要包括以下内容:

1进行数据处理分析,建立社会稳定指标体系,分析相关性和因果关系

2对指标信息进行筛选处理,建立决策树模型的社会稳定的早期预警模型

3将决策树模型应用在颜色革命企图推翻政权的国家来评估模型并做分析。

4总结工作成果,提出维护社会稳定的有效建议

1.2假设

本文作出以下基本假设,并且每个假设都是合理的。

1. 样本数据具有普遍性,不具有偶然性.

2. 选用的指标能基本反映社会稳定的情况,忽略其他指标的影响。

3. 忽略每项指标包含的数据项目对其他指标的影响。

1.3模型概述

本文选取关键指标,对数据进行预处理,综合指标对每个国家评估社会稳定进行评级,并建立决策树预警模型。这个模型能够判断国家或者地区处于哪个档次,判断社会稳定能力强弱,并可视化评分的依据即这个国家或者地区各个指标影响社会稳定的评分的占比情况。学者可以通过这个模型评估社会稳定,用于早期预警以及未来改进社会稳定的方向。

2建立社会稳定指标体系

2.1数据预处理

查阅各方资料论文 [1][2], 本文认为,社会稳定指标包括以下几项,人口,金融,经济,贫困与收入,教育,卫生,能源生产与利用,投资环境,贸易,政府财政,货币稳定等,本文从国家统计数据库得到数据,先进行数据预处理,筛选出一些与上述指标相近的项目,进而得到社会稳定指标体系。

2.2因果关系分析

由于数据项目过多,本文梳理出二级体系, 采用PCA降维依次对各个数据项目进行融合,采用最大值最小值归一化方法整理数据,再进行数据分析,本文对这些指标进行Spearman[3]相关性分析,绘制相关系数热力图。

图片4.png

图2.2.1 相关系数热力图

图2.2.1展示了热力图的形式展示了相关系数的值,主要通过颜色深浅去表示值的大小。

本文对所有10%显著性水平的两项指标均进行因果分析,结果表明这些指标(人口,政府财政,贫困与收入,经济,金融,投资环境,能源生产与使用,教育)因果关系较好,而卫生,劳动人人口指标与其余指标的因果关系较差。

3建立社会稳定的早期预警模型

3.1秩和比综合评价法

我们采用秩和比综合评价法[5] (RSR)对各样本进行评价排序,采取标准如下图3.1.1:

图片5.png

图3.1.1 标准图

如图3.1.1,其中正向指标有人口,金融,经济,劳动力人口(人),教育,卫生,能源生产与使用,投资环境,贸易,政府财政,货币稳定,图中未显示完全。

首先进行指标权重计算,计算秩值,每一个具体的评价指标按其指标值的大小进行排序,得到秩次R来代替原来的评价指标值并计算得到RSR值和排名。

模型的公式如下: ,进而根据公式得到分档排序临界值表格3.1.2:

表3.1.2 分档排序临界值表格

7.png3.2建立决策树模型

我们将整理好的数据建立entropy模型的决策树[6]。

图片6png.png

图3.2.1 训练拟合度图

如图3.2.1显示,该模型数据拟合度良好,并以此绘制出特征重要度图像。

图片7.png

图3.2.2 特征重要度图像

由图3.2.2可知,卫生这一指标占比巨大,最能影响分档等级,投资环境,经济其次。货币稳定,政府财政几乎无影响。

最终绘制出决策树,通过祖先节点对指标的阈值影响分别向下通往不同的叶子结点,运用反向推理起到早期预警的作用。

图片8.png

图片9.png

图3.2.2 决策树模型

此决策树总共分成三档式,档次越高,社会稳定评估越好,不同国家根据决策树的节点都可以追溯到具体档次,可以起到早期预警的作用。

4. 模型评估与应用

针对模型评估和应用,我们选择了一个颜色革命导致政权更迭的国家--缅甸,对应历史事件是番红花事件。

图片10.png

图4.1 缅甸指标预测结果

本文用到shap模型中的force_plot来解释每个指标的预测结果。通过决策树得知,缅甸位于第一档次国家,社会稳定性较差,针对于指标得分明细,绘制张可视化权重表,通过图4.1可得,金融得分占比权重较大,其余较小。

本文认为缅甸在金融整体具有很大的投资吸引力,竞争优势主要体现在以下几方面:国内政局相对稳定;具有丰富的自然资源和文化遗产;地理位置优越,市场潜力大;劳动力资源丰富且成本相对较低,这是社会稳定的大指标金融方面起到了作用。

番红花革命是指2007年8月-9月25日期间主要在缅甸当时的首都仰光发生的旨在反对缅甸军政府的示威游行,最终结果是政权更迭。

这一革命发生的直接原因是此前军政府突然大幅上调燃油价格,导致燃油和其他生活物资价格猛涨。而背后的真正原因则是民众对于缅甸长期实行的军人独裁统治导致的民生凋敝、黑暗腐败等现象的强烈不满。

通过我们的算法模型分析,缅甸的贸易,经济等指标在决策树模型中占比较小,属于缅甸社会稳定的薄弱方面.。政府突然大幅度提高燃油价格,对这两个指标造成极大影响,导致作用于这些因素上的力量比例严重失衡,社会变成畸形,社会稳定动摇,大规模示威游行则证明了这一点。

5. 维护社会稳定的建议

图片11.png

图5.1 指标贡献度图

本文基于shap模型的可解释性,绘制出各个指标的贡献度,通过上图5.1可发现,卫生,贸易,金融指标的贡献度较大。

图片12.png

图5.2贡献度区间图

本文又用到了回归模型中的summary_plot来绘制图。在图5.2上可以看到,卫生指标在0-0.005区间贡献度较高,贸易指标在0-0.005区间贡献度高,在<0一部分区间贡献度较高;金融方面在0-0.005区间贡献度高;劳动人口在0-0.005区间贡献度较高;能源生产与使用在0-0.005区间贡献度较高;人口,教育,政府财政,贫困与收入,货币稳定,投资环境则在趋于0区间贡献较高。

根据以上分析,为了防止颜色革命,维护社会稳定,我们提出以下建议:

1, 加强卫生,贸易,金融,经济,劳动力人口,能源生产与使用这些指标的建设工作。

2, 适当减少在教育,政府财政,贫困与收入,货币稳定,投资环境这些方面的投入。

3, 关于在各个指标上面投入多少,可以参考上述summary_plot绘图。

4, 根据国情发展,及时更新社会稳定模型。

5, 做好及时预警和防备工作。

参考文献

[1]王会芝,雷鸣,吴晨阳.社会稳定风险评估指标体系的适应性研究[J].城市,2017(08):62-65.

[2]夏帆.浅议社会稳定指标体系的构建[J].湖北经济学院学报,2005(02):60-63.

[3] 聂洪涛,韩欣悦. 我国有效专利区域发展"马太效应"困境及其调适——基于分层回归的实证研究[J]. 经济论坛,2021(8).

[4] 田凤调. 秩和比法及其应用[M]. 北京 中国统计出版社,1993.

[5]李乐茹.决策树可视化系统模型研究[J].长江大学学报(自然科学版)理工卷,2009,6(02):265-267.

作者简介:

卢经亿(2002-),男,辽宁省大连人, 就读于沈阳航空航天大学物联网工程专业,研究方向:数据挖掘

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。