PDF下载
互联网金融智能反欺诈技术研究

​邹建豪 刘龚榆 卢梦柯 戴治波

南京理工大学紫金学院,计算机与人工智能学院

摘要: 互联网金融发展迅速,金融欺诈问题突显,需要有效的反欺诈机制。本文提出基于智能算法的反欺诈方案。首先,通过深度学习分析交易数据,建立多维度用户行为画像,全面了解交易特征。其次,采用机器学习算法实时监测和分析用户行为,识别异常交易模式。引入自然语言处理技术,对用户资料和交流信息进行情感分析,提高识别准确率。最后,建立反馈机制优化算法模型,提高系统自适应性和鲁棒性。
关键词: 互联网金融;金融欺诈;反欺诈机制;深度学习;机器学习算法
DOI:10.12721/ccn.2024.157031
基金资助:
文章地址:

1  互联网金融智能反欺诈技术研究进展

1.1  互联网金融智能反欺诈技术定义

互联网金融智能反欺诈算法利用人工智能、机器学习和数据挖掘技术,实时监测、识别和预防欺诈行为。通过分析交易和用户数据,发现潜在欺诈模式和异常行为,保护金融机构和用户利益,维护金融市场秩序和安全。

1.2  互联网金融智能反欺诈技术研究进展

近年来,互联网金融业迅速发展,但也伴随着金融欺诈问题的加剧。金融欺诈也已形成完整的黑色产业链,并通过互联网技术不断加持攻击能力。[1]针对这一挑战,智能反欺诈技术备受关注,包括数据驱动的模型、行为分析、图像识别、社交网络分析和区块链应用等方面。在该领域的研究中,吴恩达、李飞飞、杨立昆、Hany Farid和Vivek Kumar Singh等领军人物的贡献不容忽视,他们的研究为该技术提供了重要支持。

2  互联网金融智能反欺诈技术的应用

2.1  基于机器学习和网络图分析的反欺诈

机器学习在互联网金融中至关重要,因为数据庞大、变化快速。传统方法难以处理复杂欺诈,而机器学习通过分析数据和识别模式,提高了欺诈检测的准确性和效率,加强了平台的安全保障和风险管理。

机器学习反欺诈算法中常用的重要性评价指标有准确率、精确率、召回率、F1分数、ROC曲线和AUC值。在《Credit Risk Analytics: Measurement Techniques, Applications, and Examples in SAS》[2]中作者介绍了在信用评分模型中使用准确率、精确率、召回率和AUC值等指标来评估模型的性能,以及如何应用这些指标来进行金融反欺诈。

除了上述评测指标,基于网络图分析也是一种经典方法,网络图分析又称Social Network Analysis是一种研究社会结构和组织关系的方法,通过分析个体之间的关系来揭示社会网络中的模式、结构和特征,包括节点代表个体或实体、边表示节点之间的关系、网络结构描述连接模式和组织形式、中心性衡量节点重要性以及社区结构发现子群体等。

Jean-Louis Dessalles提出了基于社交网络和欺诈检测之间的关系,利用社交网络分析方法来发现欺诈团伙之间的关联,并借此改进的反欺诈策略。Óskarsdóttir María等人在《Social Network Analytics for Supervised Fraud Detection in Insurance》[3]一文中探讨了社交网络和欺诈检测之间的关系,提出了一些关联以改进反欺诈策略。他通过团伙关联、群体结构关联、信息传播关联来对对社交网络结构和信息流动的分析,可以更好地理解欺诈活动的模式和特征,从而制定更有效的反欺诈对策。

2.2  基于深度学习的反欺诈

金融业是一个具有大量专家经验的传统行业,传统的欺诈检测系统大多是依靠大量的业务经验建立的专家规则系统,通过一系列的规则来判断交易是正常交易还是异常交易。[4] 基于深度学习的互联网金融反欺诈系统利用大量交易数据,通过深度学习提取特征并检测异常,不断更新模型以确保交易安全。

神经网络是深度学习的核心组成部分之一,通常也会应用在反欺诈训练与检测当中,卷积神经网络(CNN)在互联网金融反欺诈中可通过图像识别和验证码识别、信用卡欺诈检测、文本分析、时间序列数据分析对各种类型的数据进行处理和分析,帮助发现和预防各种形式的欺诈行为,CNN在互联网金融反欺诈应用的结构如图1,2016年,傅康等人在论文《Credit Card Fraud Detection Using Multi-scale Convolutional Neural Networks》[5]中提出了一种基于多尺度CNN的信用卡欺诈检测方法,利用多个尺度的卷积核来提取不同层次的特征,从而提高了欺诈检测的性能。


截图1739255671.png

图1 互联网金融反欺诈的CNN架构

CNN中的卷积操作是提取输入数据特征的核心部分。给定输入特征图��,卷积核��和偏置��,卷积操作可表示为:��=��∗��+��。在互联网金融反欺诈中,CNN通过卷积操作在验证码识别、文本数据处理和时间序列数据分析等任务中发挥着关键作用。

互联网金融数据通常稀疏,如用户行为数据,正常交易较欺诈交易少。ReLU激活函数适合处理稀疏特征,能更好地捕捉信息,提升模型泛化能力和准确性。Vinayakumar R等人将ReLU应用于基于CNN和GAN的信用卡欺诈检测,进行特征提取和增强,并结合ReLU进行非线性变换,提高欺诈检测准确性和鲁棒性。

综上所述,卷积神经网络(CNN)在互联网金融反欺诈系统中起着重要作用,应用于图像和验证码识别、信用卡欺诈检测、文本和时间序列数据分析等任务。多尺度CNN有效提高了欺诈检测性能。深度学习技术为互联网金融反欺诈提供了强大工具,重要贡献于提升交易安全性和效率性。

3.  评测指标

本文主要采用精确率、召回率和F1-Score作为欺诈检测效果的评价指标。表2为混淆矩阵,代表分类正确和分类错误的交易,通过混淆矩阵,我们给出了精确度、召回率和F1-Score的计算公式。

我们从加载的数据集中选择了收入、信用历史、债务和就业状态这四个特征作为模型的输入特征,然后使用train_test_split函数将数据集划分为训练集和测试集,其中80%的数据被用作训练集,20%的数据被用作测试集。结果如表1所示,从结果上来看我们的逻辑回归模型优于当前的其他模型。

截图1739255552.png

表1 逻辑回归模型与其他模型效果比较

4.  总结与展望

在互联网金融领域,互联网金融反欺诈一直是研究的热点。随着数字化金融服务的迅速发展和网络规模的不断扩大,欺诈检测算法需要具备高效率和可扩展性。近年来,新技术的涌现为互联网金融反欺诈提供了理论基础,如图异常检测技术中的张量分解、网络嵌入以及图神经网络等。不同方法的选择取决于实际反欺诈需求,因此达到的效果也会有所不同。本文对互联网金融反欺诈中广泛应用的机器学习、网络图和深度学习技术分析进行了综述。

参考文献

[1] 孟洁,张洪涛.基于数据挖掘的互联网金融智能反欺诈业务研究[D].北京:中国人民大学统计学院,2021.

[2] Bart Baesens,Daniel Roesch,Harald Scheule.Credit Risk Analytics: Measurement Techniques, Applications, and Examples in SAS[M].New Jersry: Inc,2016.

[3]Óskarsdóttir María. Social Network Analytics for Supervised Fraud Detection in Insurance[J].PubMed,2021,42(8):1872-1890.

[4]周欣欣.基于深度学习的网络交易欺诈模型检测的研究[D].上海:东华大学计算机科学与技术学院,2019.

[5]傅康,程大伟,涂毅,张丽青. Credit Card Fraud Detection Using Multi-scale Convolutional Neural Networks[Z].神经信息处理国际会议,2016.