[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors

会议名称:2023 IEEE Symposium on Security and Privacy (SP)

发布链接:AI-Guardian: Defeating Adversarial Attacks using Backdoors | IEEE Conference Publication | IEEE Xplore

中文译名:AI-Guardian:利用后门防御对抗攻击

阅读原因:网安相关,方班需要

本文主要介绍了一种名为AI-Guardian的框架,旨在通过神经网络后门机制抵御对抗攻击。文章首先概述了深度学习在实际应用中面临的安全威胁,特别是对抗攻击的问题,并强调了研究有效防御策略的重要性。接着,文章提出了AI-Guardian框架,该框架在模型训练阶段注入后门样本,并在预测阶段利用后门处理和标签双射关系来返回正确的预测结果。通过与现有防御策略的比较,AI-Guardian显示出更好的防御效果、更小的时间开销,并且对模型原有表现的影响较小。最后,文章通过一系列实验验证了AI-Guardian的有效性,包括攻击成功率、模型预测时间开销、模型训练时间开销和模型准确率的影响评估。

1.研究背景和问题:

(1)实际应用场景和问题提出

深度学习对输入数据敏感,很容易受到对抗攻击,存在严重的安全问题。
对抗攻击(Adversarial Attack)是指攻击者通过故意篡改输入数据,使机器学习模型产生错误预测的攻击方式。这种攻击利用了深度学习模型对输入数据的敏感性,通过在原始数据中添加细微的扰动或噪声,使得这些经过修改的数据(称为对抗样本)被模型误分类。对抗攻击可以在多种应用场景中发生,包括图像识别、语音识别和自然语言处理等。由于对抗样本在人类看来与原始数据几乎无异,但模型却会做出截然不同的错误判断,因此对抗攻击对AI系统的安全性构成了严重威胁。
现有的对抗攻击防御策略存在效果有限、影响模型原有表现等问题,不能彻底抵御对抗攻击。

(2)问题的研究意义

对抗攻击本质就是欺骗AI模型,对AI系统的正常运转造成严重干扰。一旦发生在某些关键领域,如自动驾驶、智能医疗,将带来严重安全隐患,甚至造成严重安全事故。随着深度学习技术越来越广泛的应用,研究合适的对抗攻击防御策略刻不容缓。

(3)问题的研究现状

现有对抗攻击防御策略主要分为两大类:离线防御策略和在线防御策略。

  1. 离线防御策略:这类策略主要在模型训练阶段实施,旨在提高模型对对抗样本的鲁棒性。典型的方法包括:

    • 对抗训练(Adversarial Training):通过在训练数据中加入对抗样本来增强模型的抗攻击能力。缺点是会增加模型训练的时间开销,并且可能影响模型对正常样本的识别准确率。
    • 模型蒸馏(Model Distillation):通过将复杂模型的知识转移到简化模型中,以提高模型的泛化能力和鲁棒性。缺点是需要额外的模型训练过程,且可能降低模型的性能。
  2. 在线防御策略:这类策略在模型预测阶段实施,旨在检测并抵御对抗样本的攻击。典型的方法包括:

    • 压缩或平滑算法:通过对输入数据进行压缩或平滑处理,以减少对抗样本的影响。缺点是可能会增大模型预测的时间开销,且在某些情况下会降低模型的准确率。
    • 对抗样本检测:使用特定的算法来检测输入数据是否为对抗样本。缺点是可能需要额外的计算资源,且可能存在误报和漏报的情况。

总体而言,这些防御策略各有优缺点,但都面临着提高模型鲁棒性与保持模型性能之间的平衡挑战。

(4)作者的方案

文中提出的对抗攻击防御策略是AI-Guardian框架,它主要通过在模型训练阶段注入后门样本,并在预测阶段利用后门处理和标签双射关系来抵御对抗攻击。具体来说:

  1. 后门样本生成:在模型训练阶段,针对原始训练样本生成一批经过后门处理的样本(称为后门样本),这些后门样本与原始样本在视觉上相似但具有特定的标记。
  2. 标签双射关系:为每个后门样本分配一个对应的标签,这个标签与原始标签存在一一对应关系(即双射)。
  3. 后门注入:将生成的后门样本及其对应的标签加入到训练集中,使模型在学习过程中同时对原始样本和后门样本进行学习。
  4. 预测阶段的处理:在模型预测阶段,输入数据首先经过后门处理,然后模型根据处理后的数据输出预测结果。由于模型已经学习了后门样本,因此能够在一定程度上抵御对抗样本的攻击。
  5. 标签双射关系的利用:根据后门样本的标签双射关系,将模型输出的预测结果转换为对应的真实标签,从而返回正确的预测结果。

通过这种方法,AI-Guardian能够有效提高模型对对抗攻击的防御能力,同时保持较小的时间开销和对模型原有表现的影响。

2.技术框架 方法论:

(1)相关知识和基本原理

神经网络后门(Neural Network Backdoor)是指在神经网络模型中植入的一种隐藏行为,使得攻击者可以通过特定方式触发这些行为,从而控制模型的输出。具体来说,后门攻击通过在训练数据中插入特定的“后门”样本,这些样本与正常样本相似,但具有特定的标记或特征。在模型训练过程中,这些后门样本被学习到,导致模型在遇到类似的输入时会按照攻击者的意图输出特定的结果。
例如,一个图像分类模型可能在训练时被注入了某些特定图案的图像,这些图像都被标记为某个特定类别。当模型部署后,如果用户输入包含这些特定图案的图像,模型就会错误地将其分类为那个特定类别,从而实现攻击者的控制意图。

双射:指一一对应关系(数学用语)

(2)本文的方法概述

本文提出了AI-Guardian框架,本质是让模型预测结果受到后门控制,而很难被攻击者操纵,从而抵御对抗攻击。在模型训练阶段,AI-Guardian会针对原始训练样本生成一批后门样本(经过后门处理的样本),按标签双射关系为后门样本分配对应标签,实现后门注入;在模型预测阶段,AI-Guardian先对输入数据进行后门处理,然后将其输入到模型,根据模型输出结果、标签双射关系返回对输入数据真实标签的预测结果。

(3)核心原理

如下图,蓝色实线是模型的决策边界,攻击者目标:把A样本加噪后使得模型对A'(就是B)分类到类别3中(而非真实的类别1)。作者的设计直觉是:C点表示添加了触发器的干净图像A,被归类为2类中,即使遭受到了攻击(加噪过程,变成D),也还是会被分类为真实的类别2中。D可能会越过决策边界,但是经过作者的评估,这种可能性很低。

  1. 后门样本生成与注入

    • 在模型训练阶段,针对原始训练样本生成一批经过特定处理的后门样本。这些后门样本与原始样本在视觉上相似,但具有特定的标记或特征。
    • 为每个后门样本分配一个对应的标签,这个标签与原始标签存在一一对应关系(即双射)。
    • 将生成的后门样本及其对应的标签加入到训练集中,使模型在学习过程中同时对原始样本和后门样本进行学习。
  2. 标签双射关系的利用

    • 在模型预测阶段,输入数据首先经过后门处理,然后输入到模型中。
    • 根据模型输出的结果和预先定义的标签双射关系,将模型输出的预测结果转换为对应的真实标签,从而返回正确的预测结果。
  3. 防御机制

    • 由于模型在训练过程中已经学习了后门样本,因此在遇到对抗样本时,模型能够在一定程度上抵御这些攻击。这是因为对抗样本通常依赖于模型对特定模式的敏感性,而后门样本的训练使得模型对这些模式有了额外的鲁棒性。
    • 通过标签双射关系,可以纠正模型在面对对抗样本时的误判,从而确保模型输出的正确性。
  4. 计算效率

    AI-Guardian引入的额外数据预处理操作是一个轻量级的打补丁操作,计算量小且不破坏图像的有效信息。因此,它对模型预测时间的影响非常小。

(4)方法的讨论与分析

与现有离线防御策略相比,AI-Guardian采用了“后门训练”策略,让模型的输出受到后门控制,从而更好地提升了模型稳定性;与现有在线防御策略相比,AI-Guardian引入的额外数据预处理操作是一个打补丁操作,计算量小,而且不破坏图像有效信息,因此对模型原有表现的影响更小,引入的时间开销也更小。实验证明,AI-Guardian取得的防御效果好于现有代表性对抗攻击防御策略。

3.实验设计与结果分析:

(1)攻击成功率对比实验:作者对比了AI-Guardian和其它6种代表性对抗攻击防御策略:EAT、Madry、FIBTF、JPEG Compression、TVM、Trapdoor在4个数据集(MNIST、GTSRB、Youtube-Face、VGG-Face)上的攻击成功率变化情况。AI-Guardian可将平均攻击成功率从97.3%降至3.2%,而其它方法中效果最好的TVM只将平均攻击成功率从97.3%降至11.6%。说明AI-Guardian具有更好的防御效果。

(2)模型预测时间开销对比:对比AI-Guardian与JPEG Compression、TVM、Trapdoor策略在MNIST,GTSRB,Youtube-Face,VGG-Face这4个数据集上的模型预测时间开销,发现每个数据集上AI-Guardian引入的时间开销比例均小于1%,远小于其它方法。说明引入AI-Guardian不会显著增加模型预测时间。

(3)模型训练时间开销对比:对比AI-Guardian与EAT、Madry、FIBTF、Trapdoor在MNIST,GTSRB,Youtube-Face,VGG-Face这4个数据集上所需的模型训练时间。实验中AI-Guardian所需平均模型训练时间8.4h,仅比最快的方法FIBTF多0.2h。说明AI-Guardian不会引起较大的额外模型训练时间开销

(4)模型准确率影响评估:对比MNIST,GTSRB,Youtube-Face,VGG-Face这4个数据集上AI-Guardian对模型准确率的影响。结果表明,在引入AI-Guardian后,模型平均准确率只下降0.5%,说明AI-Guardian几乎不影响模型原有表现。

4.结论与展望:

优点

  1. 更好的防御效果

    AI-Guardian能够显著降低对抗攻击的成功率,从97.3%降至3.2%,优于其他代表性防御策略。这表明它在抵御对抗攻击方面具有更高的有效性。
  2. 更小的时间开销

    在模型预测时间开销方面,AI-Guardian引入的时间开销比例远小于1%,远低于其他方法。这意味着它对模型预测速度的影响非常小,不会显著增加延迟。
  3. 较小的训练时间开销

    实验结果显示,AI-Guardian的平均训练时间为8.4小时,仅比最快的FIBTF方法多0.2小时。这表明它不会引起显著的训练时间增加,保持了较高的训练效率。
  4. 对模型准确率影响极小

    AI-Guardian对模型准确率的影响极小,平均准确率下降仅0.5%。这意味着它在提高模型鲁棒性的同时,几乎不影响模型的原有表现。
  5. 独特的后门机制

    AI-Guardian基于神经网络后门机制,通过在训练阶段注入后门样本并在预测阶段利用标签双射关系来抵御攻击。这种机制使得模型对特定模式具有额外的鲁棒性,从而更好地抵御对抗样本的攻击。

缺点

  1. 后门模型预测标签与输入数据真实标签的一一对应要求

    AI-Guardian要求后门模型预测标签必须与输入数据的真实标签存在一一对应的关系。这种严格的要求使得模型训练过程更加复杂和苛刻,可能需要更多的人工干预和调整。
  2. 潜在的隐私和安全问题

    由于AI-Guardian在模型中植入了后门样本,这可能引发对模型安全性和隐私问题的担忧。如果攻击者能够识别并利用这些后门,可能会导致更严重的安全风险。
  3. 适用范围的限制

    虽然AI-Guardian在实验中表现出色,但其有效性和适用性仍需在不同应用场景中进一步验证。某些特定领域或数据集可能对后门机制有不同的反应,需要针对性地进行调整和优化。
  4. 模型训练复杂度增加

    尽管实验结果显示AI-Guardian的训练时间开销相对较小,但后门样本的生成和注入过程仍然增加了模型训练的复杂度。对于大规模数据集和复杂模型,这种额外的训练负担可能会更加显著。

本文提出AI-Guardian框架,基于神经网络后门机制抵御对抗攻击,利用标签双射关系来返回正确预测结果。与现有对抗攻击防御策略相比,本文方法具有更好的防御效果、更小的时间开销,且对模型原有表现很小。然而,AI-Guardian要求后门模型预测标签必须与输入数据真实标签一一对应,这对模型训练的要求更加苛刻。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1550461.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

记一次教学版内网渗透流程

信息收集 如果觉得文章写的不错可以共同交流 http://aertyxqdp1.target.yijinglab.com/dirsearch dirsearch -u "http://aertyxqdp1.target.yijinglab.com/"发现 http://aertyxqdp1.target.yijinglab.com/joomla/http://aertyxqdp1.target.yijinglab.com/phpMyA…

IT基础监控范围和对象

监控易作为一款由美信时代独立自主研发的分布式一体化集中监控平台,其监控范围极为广泛,几乎涵盖了所有主流的IT基础设施以及相关的设备和系统。以下是对监控易监控范围的详细介绍: 一、IT基础资源监控 服务器硬件监控:监控易支…

fmql之Linux阻塞和非阻塞IO

继续学习正点原子吧。 概念简介 什么是阻塞、非阻塞IO 阻塞/非阻塞访问的代码示例 等待队列(阻塞访问使用) 轮询(非阻塞访问使用) poll操作函数的使用(轮询的一种) 阻塞IO的实验 blockio.c blockioAPP.c 运…

大模型能力扩展之——提示词(Prompt),知识库,思维链(CoT)和Agent(代理)

前言 “大模型的推理能力配合外部工具才能真正发挥大模型的作用” 在学习和使用大模型的过程中,我们会发现大模型只能用来进行一下简单的问答;一旦涉及到复杂的问题,大模型就无能为力了。 其原因就在于我们并不会使用大模型,或…

【韩顺平Java笔记】第3章:变量

只记录我觉得重点的,自用,如果有漏的请自己看视频 文章目录 33. 内容梳理34. 变量原理34.1 为什么需要变量35. 变量概念35.1 概念35.2 变量使用的基本步骤36. 变量入门36.1 变量使用入门案例 37. 变量细节37.1 变量使用注意事项 38. 加号使用38.1 程序中…

Node.js安装Express,Node.js支持Typescript以及Express支持Typescript的步骤

1. Node.js 安装Express 运行如下命令: $ mkdir express-demo $ cd express-demo$ npm install express $ npm install body-parser //(可选)中间件,用于处理 JSON, Raw, Text 和 URL 编码的数据 $ npm install cookie-parser //(可选)通过req.cookies…

如何使用ssm实现大学生校园招聘网的设计与实现

TOC ssm738大学生校园招聘网的设计与实现jsp 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现,改变了几千年以来人们的生活,不仅仅是生活物资的丰富,还有精神层次的丰富。在互联网诞生之前,地域位置往往是人们思想上不可跨域…

网页WebRTC电话和软电话哪个好用?

关于WebRTC电话与软件电话哪个更好用,这实际上取决于多个因素,并没有一个绝对的答案。不过,我可以根据WebRTC技术的一些特点,以及与传统软件电话相比的优劣势,为你提供一个清晰的对比。 首先,让我们了解一下…

单细胞miloR分析(基于 KNN 图的细胞差异丰度分析方法)

通常情况下,对两组或多组样本进行了不同处理/干预之后,研究者首先会进行同种细胞亚群处理前后的细胞数量的比较,但在单细胞分辨率时代之后,即使是同一个亚群中的不同细胞也应当看成不同的样本。 那么问题就来了,既然应…

算法:按既定顺序创建目标数组

力扣1389 提示&#xff1a; 1 < nums.length, index.length < 100nums.length index.length0 < nums[i] < 1000 < index[i] < i 题解&#xff1a; class Solution {public int[] createTargetArray(int[] nums, int[] index) {int[] target new int[num…

SD2.0 Specification之CRC(Cyclic Redundancy Code)

文章目录 本文章主要讲解关于SD2.0中的CRC应用&#xff0c;其它基础概念和其它内容请参考以下文章。 SD2.0 Specification简述 CRC全称为Cyclic Redundancy Code&#xff0c;中文名称是循环冗余校验&#xff0c;该方法通过附加冗余数据来保证数据的完整性&#xff0c;即用于检…

RabbitMQ的高级特性-限流

消息分发: RabbitMQ队列拥有多个消费者时, 队列会把收到的消息分派给不同的消费者. 每条消息只会发送给订阅列表⾥的⼀个消费者. 这种⽅式⾮常适合扩展, 如果现在负载加重,那么只需要创建更多的消费者来消费处理消息即可. 默认情况下, RabbitMQ是以轮询的⽅法进⾏分发的, ⽽不管…

BetterAndBetter--Mac上强大的手势操控软件,让你的Mac更加得心应手

很多新人在开始使用Mac的时候&#xff0c;很难脱离鼠标操作&#xff0c;但是Mac的触摸板可以说是Mac的一大特色&#xff0c;能够完成非常多的操作&#xff0c;甚至在有些时候比鼠标更加的好用&#xff0c;那么新手该如何使用触摸板呢&#xff0c;BetterAndBetter可以帮助新手快…

Alternative Reconciliation Accounts 备选统驭科目

业务场景&#xff1a; #1 海外项目对于应付账款&#xff0c;超过1年期的需要转入到其他科目&#xff1b; #2. 通过备选统驭科目进行 从应付账款&#xff0c;到应付账款-长期的结转 备选统驭科目的使用与配置 备选统驭科目&#xff08;AlternativeReconciliation Accounts)就…

Dynamics 365 dependency EntityType

导解决方案时经常会碰到组件依赖导致导入报错&#xff0c;而错误提示中组件只有type, 比如下图中的type 20和60, 初看之下并不知道是什么意思&#xff0c;从parentDisplayName能看出来&#xff0c;这个parent是个实体&#xff0c;但实体中的什么呢&#xff0c;目测是看不出来的…

怎样用python+sqlalchemy获得mssql视图对应物理表关系(二)

话不多说 目标:为了实现低代码数据视图对接,有必要得到视图所对应物理表及字段名称,字段类型等 1)约束:视图中用到的物理表不能起别名,所以修改上一篇中存储过程建立语句 USE [agui_conn] GO /****** Object: StoredProcedure [dbo].[sp_GetOrdersByTimestamp] Script D…

生信机器学习入门4 - 构建决策树(Decision Tree)和随机森林(Random Forest)分类器

机器学习文章回顾 生信机器学习入门1 - 数据预处理与线性回归&#xff08;Linear regression&#xff09;预测 生信机器学习入门2 - 机器学习基本概念 生信机器学习入门3 - Scikit-Learn训练机器学习分类感知器 生信机器学习入门4 - scikit-learn训练逻辑回归&#xff08;L…

第五周做题总结_数据结构_队列与应用

id:43 A. DS队列之银行排队 题目描述 银行营业大厅共服务3种客户&#xff0c;类型为A\B\C&#xff0c;大厅分别设置了3个窗口分别服务三种客户&#xff0c;即每个窗口只服务一种客户。现有一批客户来银行办理业务&#xff0c;每个客户都有类型和办理业务时间。每个窗口按照客…

Servlet详细讲解(一篇就够)

目录 一、Servlet 1.1 Servlet介绍 1.2 HTTP 1.2.1 在http请求中有请求报文 1.2.2 在http响应中有响应报文 1.3 GET和POST 1.3.1 GET 1.3.2 POST 二、第一个Servlet程序[重点] 2.1 创建web项目 2.2 pom依赖 2.3 编写Servlet 2.4 配置Servlet 2.5 部署项目 2.6 启…

C++进阶知识2 多态

多态 1. 多态的概念2. 多态的定义及实现2.1 多态的构成条件2.1.2 虚函数2.1.3 虚函数的重写/覆盖2.1.5 虚函数重写的⼀些其他问题2.1.6 override和final关键字2.1.7 重载/重写/隐藏的对⽐ 3. 多态的原理3.2 多态的原理3.2.1 多态是如何实现的3.2.2 动态绑定与静态绑定3.2.3 虚函…