v1v2 (latest)

AudioJailbreak: Jailbreak Attacks against End-to-End Large Audio-Language Models

20 May 2025

Papers citing "AudioJailbreak: Jailbreak Attacks against End-to-End Large Audio-Language Models"

38 / 38 papers shown

Title
A Red Teaming Roadmap Towards System-Level Safety Zifan Wang Christina Q. Knight Jeremy Kritz Willow Primack Julian Michael AAML 24 0 0 30 May 2025
Ask in Any Modality: A Comprehensive Survey on Multimodal Retrieval-Augmented Generation Mohammad Mahdi Abootorabi Amirhosein Zobeiri Mahdi Dehghani Mohammadali Mohammadkhani Bardia Mohammadi Omid Ghahroodi M. Baghshah Ehsaneddin Asgari RALM 346 7 0 12 Feb 2025
AdvWave: Stealthy Adversarial Jailbreak Attack against Large Audio-Language Models Mintong Kang Chejian Xu Yue Liu AAML AuLLM 107 10 0 11 Dec 2024
Recent Advances in Speech Language Models: A Survey Wenqian Cui Dianzhi Yu Xiaoqi Jiao Ziqiao Meng Guangyan Zhang Qichao Wang Yiwen Guo Irwin King AuLLM 193 25 0 01 Oct 2024
Comparing Discrete and Continuous Space LLMs for Speech Recognition Yaoxun Xu Shi-Xiong Zhang Jianwei Yu Zhiyong Wu Dong Yu AuLLM 79 8 0 01 Sep 2024
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming Zhifei Xie Changqiao Wu AuLLM VGen VLM SyDa LRM 83 73 0 29 Aug 2024
Jailbreak Attacks and Defenses Against Large Language Models: A Survey Sibo Yi Yule Liu Zhen Sun Tianshuo Cong Xinlei He Jiaxing Song Ke Xu Qi Li AAML 118 111 0 05 Jul 2024
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs Keyu An Qian Chen Chong Deng Zhihao Du Changfeng Gao ... Bin Zhang Qinglin Zhang Shiliang Zhang Nan Zhao Siqi Zheng AuLLM 139 57 0 04 Jul 2024
Unveiling the Safety of GPT-4o: An Empirical Study using Jailbreak Attacks Zonghao Ying Aishan Liu Xianglong Liu Dacheng Tao 124 25 0 10 Jun 2024
Voice Jailbreak Attacks Against GPT-4o Xinyue Shen Yixin Wu Michael Backes Yang Zhang AuLLM 88 18 0 29 May 2024
Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks Maksym Andriushchenko Francesco Croce Nicolas Flammarion AAML 204 222 0 02 Apr 2024
Optimization-based Prompt Injection Attack to LLM-as-a-Judge Jiawen Shi Zenghui Yuan Yinuo Liu Yue Huang Pan Zhou Lichao Sun Neil Zhenqiang Gong AAML 146 57 0 26 Mar 2024
AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling Jun Zhan Junqi Dai Jiasheng Ye Yunhua Zhou Dong Zhang ... Jie Fu Tao Gui Tianxiang Sun Yugang Jiang Xipeng Qiu MLLM 95 136 0 19 Feb 2024
HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal Mantas Mazeika Long Phan Xuwang Yin Andy Zou Zifan Wang ... Nathaniel Li Steven Basart Bo Li David A. Forsyth Dan Hendrycks AAML 112 418 0 06 Feb 2024
Risk Taxonomy, Mitigation, and Assessment Benchmarks of Large Language Model Systems Tianyu Cui Yanling Wang Chuanpu Fu Yong Xiao Sijia Li ... Junwu Xiong Xinyu Kong ZuJie Wen Ke Xu Qi Li 162 64 0 11 Jan 2024
Tree of Attacks: Jailbreaking Black-Box LLMs Automatically Anay Mehrotra Manolis Zampetakis Paul Kassianik Blaine Nelson Hyrum Anderson Yaron Singer Amin Karbasi 91 272 0 04 Dec 2023
DeepInception: Hypnotize Large Language Model to Be Jailbreaker Xuan Li Zhanke Zhou Jianing Zhu Jiangchao Yao Tongliang Liu Bo Han 124 190 0 06 Nov 2023
Jailbreaking Black Box Large Language Models in Twenty Queries Patrick Chao Alexander Robey Yan Sun Hamed Hassani George J. Pappas Eric Wong AAML 160 710 0 12 Oct 2023
NExT-GPT: Any-to-Any Multimodal LLM Shengqiong Wu Hao Fei Leigang Qu Wei Ji Tat-Seng Chua MLLM 109 507 0 11 Sep 2023
BLSP: Bootstrapping Language-Speech Pre-training via Behavior Alignment of Continuation Writing Chen Wang Minpeng Liao Zhongqiang Huang Jinliang Lu Junhong Wu Yuchen Liu Chengqing Zong Jiajun Zhang AuLLM 129 45 0 02 Sep 2023
Inaudible Adversarial Perturbation: Manipulating the Recognition of User Speech in Real Time Xinfeng Li Chen Yan Xuancun Lu Zihan Zeng Xiaoyu Ji Wenyuan Xu AAML 90 9 0 02 Aug 2023
Universal and Transferable Adversarial Attacks on Aligned Language Models Andy Zou Zifan Wang Nicholas Carlini Milad Nasr J. Zico Kolter Matt Fredrikson 297 1,527 0 27 Jul 2023
Abusing Images and Sounds for Indirect Instruction Injection in Multi-Modal LLMs Eugene Bagdasaryan Tsung-Yin Hsieh Ben Nassi Vitaly Shmatikov 80 86 0 19 Jul 2023
Llama 2: Open Foundation and Fine-Tuned Chat Models Hugo Touvron Louis Martin Kevin R. Stone Peter Albert Amjad Almahairi ... Sharan Narang Aurelien Rodriguez Robert Stojnic Sergey Edunov Thomas Scialom AI4MH ALM 463 12,123 0 18 Jul 2023
BuboGPT: Enabling Visual Grounding in Multi-Modal LLMs Yang Zhao Zhijie Lin Daquan Zhou Zilong Huang Jiashi Feng Bingyi Kang MLLM 82 112 0 17 Jul 2023
PandaGPT: One Model To Instruction-Follow Them All Yixuan Su Tian Lan Huayang Li Jialu Xu Yan Wang Deng Cai MLLM 99 295 0 25 May 2023
SpeechGPT: Empowering Large Language Models with Intrinsic Cross-Modal Conversational Abilities Dong Zhang Shimin Li Xin Zhang Jun Zhan Pengyu Wang Yaqian Zhou Xipeng Qiu AuLLM MLLM 132 344 0 18 May 2023
InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning Wenliang Dai Junnan Li Dongxu Li A. M. H. Tiong Junqi Zhao Weisheng Wang Boyang Albert Li Pascale Fung Steven C. H. Hoi MLLM VLM 168 2,101 0 11 May 2023
Robust Speech Recognition via Large-Scale Weak Supervision Alec Radford Jong Wook Kim Tao Xu Greg Brockman C. McLeavey Ilya Sutskever OffRL 230 3,766 0 06 Dec 2022
Towards Understanding and Mitigating Audio Adversarial Examples for Speaker Recognition Guangke Chen Zhe Zhao Fu Song Sen Chen Lingling Fan Feng Wang Jiashui Wang AAML 110 40 0 07 Jun 2022
Universal Adversarial Perturbations Generative Network for Speaker Recognition Jiguo Li Xinfeng Zhang Chuanmin Jia Jizheng Xu Li Zhang Y. Wang Siwei Ma Wen Gao AAML 66 46 0 07 Apr 2020
Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems Guangke Chen Sen Chen Lingling Fan Xiaoning Du Zhe Zhao Fu Song Yang Liu AAML 114 197 0 03 Nov 2019
The Curious Case of Neural Text Degeneration Ari Holtzman Jan Buys Li Du Maxwell Forbes Yejin Choi 215 3,214 0 22 Apr 2019
Imperceptible, Robust, and Targeted Adversarial Examples for Automatic Speech Recognition Yao Qin Nicholas Carlini Ian Goodfellow G. Cottrell Colin Raffel AAML 98 381 0 22 Mar 2019
Adversarial Attacks Against Automatic Speech Recognition Systems via Psychoacoustic Hiding Lea Schonherr Katharina Kohls Steffen Zeiler Thorsten Holz D. Kolossa AAML 89 291 0 16 Aug 2018
CommanderSong: A Systematic Approach for Practical Adversarial Voice Recognition Xuejing Yuan Yuxuan Chen Yue Zhao Yunhui Long Xiaokang Liu Kai Chen Shengzhi Zhang Heqing Huang Xiaofeng Wang Carl A. Gunter AAML 103 356 0 24 Jan 2018
Towards Deep Learning Models Resistant to Adversarial Attacks Aleksander Madry Aleksandar Makelov Ludwig Schmidt Dimitris Tsipras Adrian Vladu SILM OOD 329 12,161 0 19 Jun 2017
Explaining and Harnessing Adversarial Examples Ian Goodfellow Jonathon Shlens Christian Szegedy AAML GAN 286 19,163 0 20 Dec 2014