基于GScRNN神经网络的对抗样本防御方法
摘要: 深度神经网络(DNN)的日益发展被应用到图像语音识别等多个领域之中,然而面对输入样本的轻微改变,经过DNN复杂的内部神经元可能导致细小的扰动被大幅度地扩大,从而使得神经网络模型的输出结果完全不同于人工判别结果,对于自然语言处理任务中,可以诱导欺骗垃圾邮件短信识别系统。通过统计词向量空间各个维度分布变化,提出一种基于高斯分布的中性词构造方法(GSNeutral),在此基础上建立GScRNN网络,纠正出输入样本中存在扰动的部分,通过中性词替换该部分达到平滑判别边界的目的。