基于人工智能(AI)模型的保险反欺诈案例的应用研究
彭程 刘张思农 陈默
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

彭程 刘张思农 陈默,. 基于人工智能(AI)模型的保险反欺诈案例的应用研究[J]. 人工智能研究,2023.1. DOI:10.12721/ccn.2023.157173.
摘要: 保险欺诈对于保险行业的健康发展造成严重的威胁。不利于保险市场规范,影响保险企业正常生产经营。保险企业的业务涉及到人们生活的方方面面,因此保险风险无处不在,使得保险市场拥有广阔的前景。但是保险公司不能完整获取被保人信息,信息不对称使得保险公司在赔付中往往处于弱势地位,给保险保险公司造成巨大经济损失,欺诈行为经常出现。本文采用国内财险公司截至2020 年 4 月发生的车险理赔案件作为研究数据,并结合人工智能技术的发展对其进行研究,利用WDL模型对各项数据进行分析,并制定研究指标实现量化分析,分析人工智能模型在保险反欺诈业务中的作用。此外,本文还进行了保险反欺诈业务需求的分析,对提调率和模型反应速度也进行了测试。本文利用保险公司往期保险理赔数据,依据大数据分析、互联网技术、深入学习等充分挖掘数据内在价值,及时识别保险业务开展中的风险因素,提升人工智能在保险行业上的作用,对于规范保险市场,维护保险企业合法权益发挥重要作用。
关键词: 人工智能(AI);保险反欺诈;特征工程
DOI:10.12721/ccn.2023.157173
基金资助:

绪论

改革开放以来我国经济取得巨大进步,经济的发展使得保险行业获得很好的发展市场,根据我国市场调查显示,在2021年我国的保险保费数额达到 4.49 万亿,已成为世界第二大保险缴费最高的国家。虽然我国保险市场呈现出繁荣的发展景象,但是骗保的情况非常常见,保险企业遭受的损失也在不断增加。在上个世纪末,西方资本国家就曾经因为骗保情况的出现,造成经济市场秩序出现混乱,严重威胁当地经济发展和社会稳定。因此,本文通过对保险公司以往的保险理赔经验数据进行分析,分析人工智能在反欺诈方面的价值和作用,一方面能够为当前反欺诈行为避免提供指导依据,另一方面也可以帮助保险公司识别风险因子,完善反欺诈措施。

2人工智能对保险反欺诈的作用机制

根据2006年《预防、发现和纠正保险欺诈指引》由国际保险监督官协会特别制定的,依据保险企业的市场需求和经营方式出台相关的反欺诈措施,依据实际的研究需求将其划分为内部、中介、个人三方面。内部欺诈指就是保险公司内部人员开展的欺诈行为,一般是在上层领导的授意下联合外部人员开展的欺诈行为。内部欺诈的主要表现形式为,获取客户信息、骗取企业资金等,这也是保险欺诈中经常出现的行为。内部欺诈中各项条款会在内部人员的操作中不利于保险企业。并且信息的不对称也使得保险企业不能第一时间掌握各项情况。

 中介欺诈是指中介作为投保人和保险公司之间搭建的桥梁,并在保险理赔的过程中造成各项信息之间的不对称,获取保险企业获取的数据信息存在虚假情况,因此中介欺诈的问题值得保险公司进行一些关注。保单持有人欺诈是指投保人以个人的方式或者多人串通的方式,在购买保险产品的过程采取不正当的方式和手段获取经济利益,对保险企业的合法权益造成侵害的行为。

人工智能是在大数据分析基础上对潜在风险因子进行挖掘总结。完善各项管理措施,实现对欺诈行为的有效识别。

3 模型理论

本文将各项数据整合之后,在数据分析和深度学习基础上,依据保险企业欺诈行为的管理获取各项指标,依据本文研究使用的 XGBoost 模型对结果进行分析对比,对本文研究方式的优势进行总结。具体测试模型如表1 所示:

6.png

表 1测试模型列表

由于本文使用深度学习模型的目的仅仅是为了与主模型进行横向比较,主要是对模型特征的提取,因此深度学习模型不再赘述,仅仅是简单的了解即可。下面是在WDL模型基础上提出的模型关系图。具体关系如图1 所示:

69.png

图1WDL模型关系图

3模型原理

WDL模型,也叫做深度模型,是深度学习模型的一种,属于浅层学习结构。具有线性分析和学习能力,在很多方面都有重要价值,依据数据实现特征的提取和量化指标分析。WDL模型于 2016 年由谷歌团队所提出,主要的目的是提升谷歌软件的市场竞争力,优化谷歌软件运营环境,进而实现谷歌市场的拓展,获取更多市场份额。

5555.png

图 2 WDL 模型网络架构示意图

4  实证分析

数据分析中对各项数据的有效甄别,以此实现数据信息价值的挖掘和技术的改善,为本文研究中使用到的混淆矩阵提供创建工具。用该矩阵行中的数值实现对各项指标量化分析,充分挖掘潜在数据价值,列中的数值表示样本数据的真正类型。混淆矩阵中将各列数据相加的结果即为模型对全部样本中进行预测后所得结果中相应类别的真实样本数量;将混淆矩阵中将各行数据相加的结果即为模型对全部样本中进行预测后所得结果中相应类别的真实样本数量。

对于二元分类问题,上述数据的分析可以从正负两个类型进行划分。本文研究的数据中需要关注是否存在欺诈的特征,因此欺诈数据一般记为正,不存在欺诈特征的数据记为负。其混淆矩阵详见表 5-1 所示。

 5  研究结论与展望

本文采用国内某财险公司截至2020 年 4 月发生的车险理赔案件作为研究数据,并结合人工智能技术的发展对其进行研究,利用WDL模型对各项数据进行分析,并制定研究指标实现量化分析,分析人工智能模型在保险反欺诈业务中的作用。此外,本文还进行了保险反欺诈业务需求的分析,对提调率和模型反应速度也进行了测试。

参考文献

[1]叶明华.  基于 BP 神经网络的保险欺诈识别研究——以中国机动车保险索赔为例[J]. 保险研究, 2011(3):79-86.

[2]刘坤坤.  车险保险欺诈识别和测量模型实证研究——基于广东省车险历史索赔数据[J]. 暨南学报:哲学社会科学版, 2012, 34(8):5.  

[3]郭元凯. 基于 XGBoost 的混合模型在股票预测中的应用研究[D]. 兰州理工大学, 2020.  

[4]  Kia A.  Using  MLP  and  RBF  Neural  Networks  to  Improve  the Prediction  of  Exchange Rate  Time  Series  with  ARIMA[J].  International  Journal  of  Information  and  Electronics Engineering, 2012.

[5]  Mallqui  D  C A,  Fernandes  R A  S.  Predicting  the  direction,  maximum,  minimum  and closing prices of daily Bitcoin exchange rate using machine learning techniques[J]. Applied Soft Computing, 2018.

[6]李超. 人民币汇率波动对我国国际贸易的影响[J]. 投资与创业,2018(1):2.

[7]郑红、叶成、金永红、程云辉.  基于 Stacking 集成学习的流失用户预测方法

[J].应用科学学报, 2020, 38(6):11.

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。