PDF下载
基于GScRNN神经网络的对抗样本防御方法

牟志1 殷锋2 袁平3

1.四川大学计算机学院;2.西南民族大学计算机科学与技术学院;3.重庆第二师范学院数学与信息工程学院

摘要: 深度神经网络(DNN)的日益发展被应用到图像语音识别等多个领域之中,然而面对输入样本的轻微改变,经过DNN复杂的内部神经元可能导致细小的扰动被大幅度地扩大,从而使得神经网络模型的输出结果完全不同于人工判别结果,对于自然语言处理任务中,可以诱导欺骗垃圾邮件短信识别系统。通过统计词向量空间各个维度分布变化,提出一种基于高斯分布的中性词构造方法(GSNeutral),在此基础上建立GScRNN网络,纠正出输入样本中存在扰动的部分,通过中性词替换该部分达到平滑判别边界的目的。
关键词: 对抗攻击;对抗样本;神经网络;自然语言处理
DOI:
基金资助:
文章地址: