讲座论坛
神经网络后门防御研究
发布时间:2025-02-26 14:42:34 1170

近年来,关于后门攻击的真实案例逐渐浮出水面。例如,谷歌翻译的训练模型 被植入后门,使得模型产生博彩等不规范输出。随着AI技术在医疗、金融和军事等高风险场景中的应用不断深化,后门攻击的潜在影响愈发显著。研究后门防御技术可以缓解后门攻击威胁,增强公众对人工智能技术的信任与接受度。本报告主要介绍模型在线推理的防火墙技术,力求为人工智能技术的安全性和可靠性提供理论参考和实际方法支持,推动AI系统在复杂应用场景中的安全部署。