WEB防火墙安全网关性能与规则优化技术研究
许世强
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

许世强,. WEB防火墙安全网关性能与规则优化技术研究[J]. 中国科学研究,2022.11. DOI:10.12721/ccn.2022.157095.
摘要: 伴随着WEB应用的不断演变和完善,现阶段以WEB应用为对象的攻击层显著增多,传统防火墙已经无法有效满足当前WEB应用的安全性要求,所以国家层面以及企业层面针对WEB安全网关的需求量呈现提升趋势。本文则是基于WEB安全网关类型作为研究对象,运用分段式URL规则项冲突检测算法进行优化,由规则以及缓存优化作为出发点进行分析方案阐述,两种优化模式均可以有效提升WEB安全网关的性能标准。
关键词: WEB安全网关;规则优化;缓存优化
DOI:10.12721/ccn.2022.157095
基金资助:

1. 引言

按照国家互联网信息中心所公布的统计数据信息可以得出,仅国内的网民群体已超出7.5亿人,而国内网站个数大致为506万,在六个月的时间周期内稳定在4.8%的增长速率。伴随着互联网的爆发式扩张,WEB应用也早已覆盖至全球的所有范围。与此同时,安全性问题逐渐成为当前人们亟待解决的关键,传统防火墙能够基于控制访问原理来实现用户访问,表现出效率高、原理简单等特征,而该防火墙无法针对应用层进行分析,远远无法满足WEB安全性要求。

基于此,本文着重研究了规则优化以及缓存管理优化方法,阐述了WEB安全网关的相应功能单元,归纳URL在其中所发挥的关键性作用,搭建出了融合URL的特征点。最后借助于实验测试的方法来验证所提模型的安全性和可靠性。

2 WEB安全网关规则优化方法

不管是传统防火墙系统,亦或是WEB安全网关,其分析与检定的流量信息导出均是建立在规则基础之上。所以说规则之间的矛盾以及规则集合范围会对安全网关性能特征造成一定影响,若将基础性规则进行针对性完善,那么实际应用过程中会明显降低数据信息传递和分析时延,进而增强系统安全性。

2.1 分段式URL规则项冲突检测算法

从实际定义上来看,URL属于具备多层级的特殊架构字符串,初始发展阶段所对应的匹配算法一般并未有效发挥URL在此层面的优势,仅考虑字符串整体的匹配关联。所以在此创建出一种分段式URL规则冲突检测算法,该算法的初始步骤是以URL为分析主体,对其进行拆解研究,基础界定单元是符合“/”。此种拆分模式可以把冲突区间内的规模降低,进一步提升对比效率。

分段URL规则冲突检测模型基础架构可参见图1,图中表示了三路径模式的检测分析模型,在对较大数据规模层级的规则性作冲突检索时,仅仅需要对哈希函数中的数量以及节点作出拓展。与此同时,本节所提出的分段URL模型内核是cityhash函数表达式,借助于红黑树解析哈希冲突。 1.png

图1 分段URL规则项冲突检测模式

2.2 实验研究

此次实验测试在C++的编译环境下进行,操作系统选择为window10系统,系统的位数是64位。

测试环节所输入的URL信息集合源头可界定为两种形式,首先是搜狗实验室公布的测试数据,其中URL条数是1390条;其次是依托于数据采集单元,在实验场景下所获取的信息集合,共有2809条。测试主要是验定本文所提分段式URL算法同传统算法之间检测准确度校验,具体步骤可写为:

首先是将获取的原始数据文件作导入,检索其中的最大URL层数;

其次是各使用两种算法,对导入的原始文本集合作冲突检索,实现结果导出;

之后是存储对比结果,并同仿真初始设定的冲突条件作比较,求解两种算法的准确度结果;

最后是归纳并总结此次测试结论。

表1所示是本次测试结果,从准确率数据结果可以看出,采用传统URL检索方法,其准确度均值计算为67%,本次分段式URL冲突检测准确度均值是77%,显著高于传统检索方式。22.png

表1 冲突检测准确度测试数据结果

3 WEB安全网关缓存优化方法

同防火墙针对于运输层以及网路架构层的快速检测相比较可知,WEB安全网关对于应用层的大范围测定会在一定程度上造成时延提升,为了有效补偿此方面的短板,网关会对WEB主体作缓存处理。直接定义缓存的用户会获得及时反馈,但对于没有命中的指令作放行,此方法对于计算资源的配置具有关键性协同作用。

3.1 基于网页特征的缓存替换算法

对于网络信息数据有效调用访问的唯一标识就是URL,即对所检索或者显示的网页信息做出位置表征与映射。图2所显示的是一般网站目录的基础结构图例。在相同的网站中,表现出同一类的主题会划分在一类目录体系中,也就是表现在URL中同一个前缀序列。33.png

图2 网站树状架构

本节是将页面中内容相似性同Hybrid算法相互结合,基于此创建改进型Hybrid算法。此算法的本质应用面向于有效处理计算环节中的缓存污染问题,并将其量化表征,数学表达式可写成: 44.png

其中fnew表征为对象保存价值函数,fd代表的是初始价值函数,S定义成网页URL相似性,Cont代表分析页面内容相似性结果。

3.2 实验分析

此次测试选用对比方式针对于改进Hybrid算法的有效性进行验定,,操作系统选择为window10系统,系统的位数是64位。测试过程中使用访问日志的驱动形式来完成所有验定环节,所以该过程中应当采用较大数据规模的HTTP访问日志信息集合。

以URL命中率作为评定标准,对传统Hybrid-TL算法以及改进Hybrid算法进行比对,具体实验步骤可阐述为:

首先执行原始数据文本的预处理分析,将其调整为满足缓存仿真单元的格式类型;

其次是对该格式做输入,运行模拟器模块;

之后存储WEB请求数量,以及命中数结果;

最后采用评定表达式,求解测试最终结果。

表2所示的是最终测试得到的URL命中率数据,从结果中可以看出,改进型Hybrid可有效提升实际使用过程中的命中率。
表2 命中率数据结果55.png

4. 结论

当前发展阶段以WEB应用为对象的攻击层呈现出显著上升的趋势,传统防火墙已经无法有效满足当前WEB应用的安全性要求,所以国家层面以及企业层面针对WEB安全网关的需求量呈现提升态势。本文则是基于WEB安全网关类型作为研究对象,由规则以及缓存优化作为出发点进行分析方案阐述,从最终的实验测试结果来看,本次研究所提出的两种优化模式均可以有效提升WEB安全网关的性能标准。

参考文献

[1]  中国互联网络信息中心.  第 40 次中国互联网络发展状况统计报告[R].  北京:中国互联网络信息中心, 2017.7:8-13 页

[2]  国家信息中心信息与网络安全部.  2017 年上半年中国网络安全报告[R].  北京:国家信息中心, 2017.8:9 页

[3]  Symantec.  互联网安全威胁报告[R]. Symantec, 2017.4:33-36 页

[4]  Fan Y, Yang J W, Cheng L. Computer Network Security and Technology Research[C]. International Conference on Measuring Technology & Mechatronics Automation. IEEE, 2015:293-296P

[5]  王宇. WEB 应用防火墙的设计与实现[D].  上海交通大学, 2011:4-23 页

[6]  LIU  A  X.  Firewall  policy  change-impact  analysis  [J].  Acm  Transactions  on  Internet Technology, 2012, 11(4):1-24P

[7]  Ahmad A, Anwar Z, Hur A, et al. Formal reasoning of WEB application Firewall rules through ontological modeling[C]. Multitopic Conference. IEEE, 2013:230-237P 

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。