山东大学网安学院郭山清教授、李政教授团队在人工智能安全方向取得新成果

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

近日,网络空间安全学院郭山清教授、李政教授团队在人工智能安全方向的研究成果“Fuzz-Testing Meets LLM-Based Agents: An Automated and Efficient Framework for Jailbreaking Text-To-Image Generation Models”被网络与系统安全顶级会议IEEE S&P接收。该论文的第一作者为学院博士研究生董英凯,通讯作者为郭山清教授、李政教授。

山东大学网安学院郭山清教授、李政教授团队在人工智能安全方向取得新成果

近年来,文生图模型为艺术创作、社交媒体内容生成等领域提供了前所未有的便捷性。然而,由于其输入空间广泛且具备高度的输入灵活性,该类模型在应对越狱攻击时面临严峻挑战,攻击者可利用多样化的输入方式绕过其安全机制。尽管研究人员已提出多种越狱攻击方法来揭示此类风险,但现有技术仍面临语义困惑度高、搜索模式固定等挑战,导致攻击效率和隐蔽性受限。为此,本研究提出了新型越狱攻击框架JailFuzzer,该框架创新性地结合了模糊测试技术与大语言模型智能体的先进特性,能够根据上下文信息自适应地调整变异策略,进而自动生成自然且语义连贯的越狱提示词,完成高效且隐蔽的越狱攻击。实验表明,JailFuzzer能够对主流文生图模型以高于81.93%的成功率实现越狱攻击,致使其生成含有不当内容的恶意图片,并在综合性能上优于所有基线方法。

IEEE S&P又称Oakland,与ACM CCS、USENIX Security、NDSS并列称为网络与系统安全领域的四大国际顶级学术会议,该会议近十年的平均录用率仅为14%。

© 版权声明
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
第二届大数据分析与人工智能应用学术会议(BDAIA2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

暂无评论

none
暂无评论...