PDF下载
图像隐写分析技术研究进展

石磊1,2,3,4

1陕西地建土地工程技术研究院有限责任公司,陕西西安,710075,2陕西省土地工程建设集团有限责任公司,陕西西安,710075,3自然资源部退化及未利用土地整治工程重点实验室,陕西西安,710075,4陕西省土地整治工程技术研究中心,陕西西安,710075

摘要: 信息隐写技术是指将密文隐藏于常规且和密文不相关的普通数据中传输的一种技术。信息隐写技术在古代即有所使用,如藏头诗、隐写墨水和报纸码等。如今,借助于多媒体技术的发展,这种信息隐写技术在安全通信领域重新迸发生机。随着互联网以及信息技术的不断发展,政府、企业以及个人越来越依赖图像、语音等多媒体形式进行消息的获取和传递,而隐写技术能够将密文嵌入普通信息传递却不被发觉,这就使得公共信道可能沦为不法信息传递的通道,为夯实通信安全基础,封堵秘密通信的漏洞,公共信道的隐写分析技术研究显得颇为重要。随着隐写分析技术的深入研究,算法提取的特征越来越复杂,其维度也越来越高,导致计算复杂度不断升高,对算力要求也越来越高。同时,因为JPEG图像数据广泛应用于网络传输过程,所以面向于图像信息和语音信息的隐写分析技术在实现网络安全和通信安全方面具有重要意义。
关键词: 隐写分析;公共安全;JPEG图像数据
DOI:10.12721/ccn.2022.160356
基金资助:
文章地址:

引言

随着网络基础建设的不断推进,基于互联网的多媒体技术得到了快速发展,当前社会信息和数据传输主要是通过互联网渠道完成,而绝大部分数据和信息是形式,常见如像、视和音等。而这些通过互联网传输的多媒体信息,存在部分私密信息如国家安全相关信息、企业商业机密信息和个人隐私信息等需要特别关注。对这些的管理,一方面要保证其安全传输,防止遭到窃听、盗用和篡改等;另一方面也要对其做到充分监管,防止非法信息借助公共传输通道进行传播。基于这两点管理需求,在技术上就是要实现信息的隐写和信息的隐写分析[1]。

为实现数据的安全通信,我们通常采用数据加密的方式实现。将数据原语通过密钥加密系统转变为密文,即便敌对方截获在公共网络上传输的机密密文,也无法获取数据原语,进而实现保密通信的目的。这种传统加密系统在实现保密通信的同时,也会带来一个明显的问题,就是经过加密系统产生的密文往往是一些没有明显意义的乱码,在一定程度上这个特点也帮助敌对方更快定位密文位置。与此同时,随着计算机硬件算力的不断提升,尤其是基于分布式网络的并行计算技术的快速发展,导致传统加密算法的安全风险不断升高[2-3]。

1国内外研究现状

隐写分析过程可以看作的是对隐写过程的解码,是隐写技术的对立方向,隐写技术和隐写分析技术的关系相当于“矛与盾”的关系[4]。按照隐写分析算法是否具有针对性,隐技术主要分为用和用隐写分析两种。如果已知信息隐写所用的算法,通过分析算法的特点进行破译称之为专用隐写分析。例如针对常见的隐写算法LSB算法[5],研发人员提出了诸如WS隐写分析[6]、SPA隐写分析[7和RS隐写分析[8]方法等。对于F5隐写算法[9],也有多种隐写分析算法可对其进行高效和精准的检测。专用隐写分析技术,由于已知了隐写算法的各种特点,所以可以对数据进行高效准确的检测,但是由于专析仅仅在部分具体的隐法下有效,如果更换隐写算法,检测准确率下降明显,所以专用隐写分析技术应用范围较窄。近年来,伴随着机器学习和深度学习的快速发展,使得基于机器学习的通用隐写分析技术[10]成为隐写分析领域的热点方向,也出现了一大批识别准确率较高的隐写分析算法。

通用隐写分析是指在不针对某种特定隐写算法的隐写分析技术,普遍是基于的隐算法,通用隐过程通常分两步:(1)设计关键特征量,该特征量在密文隐写前后应该有所差异;(2)训练分类器,并将训练好的分类器用于检测,这两方面需要不断相互促进和发展。特征提取是隐写分析的关键步骤,在通用隐写分析技术初期,特征量设计较为简单,一般选择维数较低的特征量,例如针对JPEG图像, Westfeld 等[25]提出通过对比图像在隐写前后直方图特征的变化来判断是否有隐写处理;而Harmsen等人首先对JPEG图像的直方图数据作低通滤波处理,以处理后的直方图平滑效应来设计关键特征;同时也有使用差分图像的直方图特征函数比值来设计隐写分析特征。上述方法在通过识别图像直方图特征的差异,在隐写分析初期都取得了较好的隐写检测效果,但随着隐写分析技术的发展,隐写技术也出现了新的算法,新的隐写算法可以在不改变图像直方图特征的前提下实现信息隐写,这就使得上述隐写分析方法准确率急剧下降,为破译这种新的隐写算法,广大隐写分析技术人员就放弃了直方图特征,把相邻像素间的相关性最为特征提取的重点,基于这个思路,又提出了一批新的关键特征。Sullivan 等人最早认为可以使用马尔可夫随机过程表示相邻像素的变化过程[14],则可基于相邻像素的变化得到马尔可夫转移概率矩阵,并以该矩阵作为隐写分析的关键特征;2016 年,等研究人员提出使用进行判决,该特征利用进行隐写分析。但是该矩阵维度比较低,能够供判决的特征量比较少,导致隐写分析的准确率比较低,所以设计一种能够体现图像关键特征的特征向量是研究人员研究的重点内容[11]。随着研究的不断深入,等人为了提高检测准确率,提出了[12],该模型共构造106个子模型,通过组合各个子模型,模型维度可以达到34671维。SRM模型为多模型组合特征,具有较好的检测准确率。在空域富模型的基础上,为进一步提高检测准确率,有学者提出了各种基于SRM模型的优化版本,如 PSRM、tSRM、maxSRM、SRM等隐写分析方法,这些方法进一步提高了隐写分析的统计检测效果[13]。针对分类器选择问题,由于研究初期所提出的关键特征相对简单,并且也都比较低,采用FLD和SVM判决器就可满足要求。为进一步提高隐写分析的准确率,当前算法普遍使用“高维特征+集成分类器”的方法,但这种方法也具有明显的缺点,会明显增加计算复杂度。2015 年 Cogranne 等人设计了一种线性分类器,该分类器为正则化 Fisher 线性判别器的,使用LSLSMR线性分类器可以降低计算的复杂度,但是检测的准确率却较差[15]。由于能够独立分析数据并提取数据的关键特征,因此被广泛应用于隐写分析领域,在提出XuNet和 YNYNet后,基于深度学习的隐写分析算法检测能力明显超过了SRM和masSRM,但该类算法会导致计算复杂度的增加明显,这也是其无法回避的问题。

2通用隐写分析方法

通用隐写分析方法也是当前隐写分析领域的主要研究方向。关键特征提取和分类器设计也是当前通析两大关键步骤。如Avcibas 等研究人员将和多作为关键特征进行隐写分析,提取用于判断初始数据和加密数据[37];Farid提出的基于对一组含密图像及其原始载体图像的训练[16],预测DWT系数变化特征,并分析预测误差矩阵的统计特征。这种方法可以认为是借用了模式识别中的分类器思想。通过提取适当的含密图像与载体图像的差异特征,构造分类器,用大量正常和嵌入密文的图像(以不同隐写算法嵌入)对分类器进行训练,不断调整相关参数,完成训练后再用于检测。实验发现,加密图像的嵌入率越高,其检测效果越好。检测效果与训练用的图像有关,也与参数设置、特征选择以及嵌入率有关。

通用检测方法经历了一段时间的发展后,取得一些成果,但存在以下缺陷:检测精度。由于通用,对某一隐写算法的特征不如专用检测算法描述得准确,所以对某一隐写算法的检测精度不如专门检测该算法的检测方法高;嵌入率影响大。当加密图像的较高时,具有较高的检测率,当嵌入率较低时,检测正确率下降明显;实用性不高。由于大多数通用检测算法需要多个特征值来进行检测,计算量大,复杂度高,检测速度有限,离进入实用尚有一段距离。

3展望

信息隐写分析问题是非常复杂系统工程的问题,需要依托于于模式识别、概率统计图像及语言处理等各个交叉领域知识的综合运用。本文对图像和语音信息的隐写分析技术进行了研究,但还有许多问题需要研究和解决:针对图像信息的隐写分析仍然有如下内容值得研究;更好的参考图像。本文中所使用的参考图像还需要与Fridrich参考图像进行更多的比对,才能确定其对隐写分析结果的影响。事实上,我们发现,RGB彩图不同颜色通道的处理。采用差别不大的特征,对彩色图像的检测与对灰度图像的检测结果相差很大,这说明,在颜色信道之间还存在着我们尚未发现的相关性。探明这种相关性并将其反映到特征向量中,对提高彩色JPEG图像的隐写分析能力有着重要意义。

参考文献

[1] Feng Deng-Guo, Zhang Min, Li Hao, et al. Big data security and privacy protection. Chinese Joural of Computers, 2014, 37(1):246-258

[2] Petitcolas F A P, Anderson R J, Kuhn M G. Information hiding survey [J]. Proceedings of the IEEE, 1999, 87(7): 1062-1078.

[3] HAYDEN M. The price of privacy; Re-evaluating the nsa[J]. Johns Hopkins Foreign AffairsSymposium,2014.

[4] Li B, He J, Huang J, et al. A survey on image steganography and steganalysis. Journal of Information Hiding and Multimedia Signal Processing, 2011, 2(2): 142-172.

[5] Ivanna Dronyuk,Olga Fedevych,Natalia Kryvinska. Constructing of Digital Watermark Based on Generalized Fourier Transform[J]. Electronics,2020,9(7).

[6] YANG Wanxia, TANG Shanyu, LI Miaoqi, CHENG Yongfeng, ZHOU Zhili. Steganalysis of  Low Embedding Rates LSB Speech Based on Histogram Moments in Frequency Domain[J]. Chinese Journal of Electronics, 2017,26(06):1254-1260.

[7] Jiufen LIU, Yuguo TIAN, Tao HAN, Junchao WANG, Xiangyang LUO. Key searching for LSB steganography on JPEG decompressed image[J]. Science China (Information Sciences), 2016, 59(03):60-74.

[8] Xianyi Chen, Guangyong Gao, Dandan Liu, Zhihua Xia. Steganalysis of LSB Matching Using Characteristic Function Moment of Pixel Differences[J]. Chinese Communication,2016,13(07):66-73.

[9] 张坚,王让定,严迪群.一种针对UnderMP3Cover的RS隐写分析新方法[J].电信科学,2018,34(04):68-80.

[10] Aqsa Rashid,Muhammad Khurrum Rahim. Scrutiny of Steganalysis for Flipping Steganography Method[J]. Journal of Advances in Mathematics and Computer Science,2019.

[11] 田源,程义民,谢于明,汪云路.一种抗SPA分析的图像信息隐藏方法[J].中国科学技术大学学报,2008,38(12):1376-1380.

[12] Sanchita Pathak, Ratnakirti Roy, Suvamoy Changder. Performance analysis of image steganalysis techniques and future research directives[J]. Int.J.of Information and Computer Security, 2018,10(1).

[13] 叶俊辰,黄潇洒,王士林. 基于卷积神经网络的nsF5隐写检测研究[J]. 通信技术, 2019, 52(03):696-700.

[14] Jicang Lu, Fenlin Liu, Xiangyang Luo. Recognizing F5-like stego images from multi-class JPEG stego images[J]. KSII Transactions on Internet and Information Systems(TIIS),2014,8(11).

[15] Xiangyang Luo, Fenlin Liu, Chunfang Yang, Shiguo Lian, Daoshun Wang. On F5 Steganography in Images[J]. The Computer Journal,2012,55(4).