对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记

报告摘要:本报告主要介绍对抗机器学习领域的研究进展。包括但不限于以下几部分:1)两种白盒攻击的思路;2)基于迁移和查询的黑盒攻击;3)对抗防御中的对抗训练及其变种;4)鲁棒的神经网络结构;以及5)对抗向善的一些示例。 讲者介绍:王奕森,北京大学助理教授,博士生导师。研究方向为机器学习,重点关注对抗鲁棒性、弱/自监督学习理论、图学习等。目前已发表人工智能领域顶级学术论文30余篇,包括ICML、NeurIPS、ICLR等。 个人主页:https://yisenwang.github.io/
报告日期:20211004
20211004【VALSE短教程】《Adversarial Attack and Defense》特邀讲师:王奕森助理教授_哔哩哔哩_bilibili
1)两种白盒攻击的思路
思路一:(目标:犯错限定条件:不能超过一个限定范围)
在以原始样本x为中心的一块区域内,找到一个对抗样本x'使得模型犯错
【对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记】
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


一步走完:FGSM
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片

分多步走完更精确: BIM
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


进一步优化:PGD
随机初始化,不在从x出发
projection操作
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片



思路二:
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


两种思路对比:
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片



2)基于迁移和查询的黑盒攻击
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


基于迁移的攻击:
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片

基于迁移的攻击的分类:
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片



3)防御
跳过∞


4)模型鲁棒性提升:
去噪
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片

对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片


BN
对抗样本|《Adversarial Attack and Defense》对抗攻击/防御报告观看笔记
文章图片



5)对抗向善的一些示例
跳过∞

    推荐阅读