网络空间安全学院融媒体安全与认知域安全团队在《IEEE Transactions on Computational Social Systems》上发表了题为《Backdoor Attack and Defense on Deep Learning: A Survey》的综述论文。《IEEE Transactions on Computational Social Systems》年发文量333篇左右,实时影响因子4.547,中科院2区。白杨副教授为该论文第一作者,研究生邢高杰为第二作者及通讯作者,成都信息工程大学网络空间安全学院为第一单位。
后门攻击是指攻击者在模型的训练过程中,以某种方式在训练数据中嵌入特定的触发模式(Trigger),使得模型在接收到这种触发模式时表现出特定的错误行为,而在其他情况下,模型仍然正常工作(图1)。这种新兴且发展迅速的现实世界攻击方法可能会导致严重的后果。

图1后门攻击流程
论文对当前在深度学习领域中所研究的后门攻击、检测及防御方法进行了全面的综述,包括后门研究中广泛使用的模型架构、基准数据集以及评估指标,并根据不同的标准对攻击、检测和防御方法进行了分类(图2)。此外,论文分析了现有方法中的一些局限性,并在此基础上指出了几个有前景的未来研究方向。通过该综述,初学者能够对后门攻击与防御形成初步认识。此外,团队期望此项工作可以提供新的视角,进而激发针对深度学习中后门攻击与防御方法展开更多研究。

图2综述的主要结构
融媒体安全与认知域安全科研团队隶属于先进微处理器技术国家工程研究中心,既重视理论研究,也重视工程实践。近五年承担国家级项目2项,省部级项目15项,发表高水平论文(一区/二区)20余篇,其中ESI热点/高被引论文2篇。获四川省科技进步奖、中国图像图形学会科技奖、四川省教学成果一等奖等多项奖励。长期以来与产业界保持良好合作关系,横向合作经费逾千万元,服务地方经济,取得良好社会效益。
文章信息:https://doi.org/10.1109/TCSS.2024.3482723