Rapid Optimization for Jailbreaking LLMs via Subconscious Exploitation
and Echopraxia

Rapid Optimization for Jailbreaking LLMs via Subconscious Exploitation and Echopraxia

8 February 2024

ArXiv (abs)PDF HTML Github (20★)

Papers citing "Rapid Optimization for Jailbreaking LLMs via Subconscious Exploitation and Echopraxia"

9 / 9 papers shown

Title
A geometrical approach to solve the proximity of a point to an axisymmetric quadric in space Bibekananda Patra Aditya Mahesh Kolte Sandipan Bandyopadhyay 91 11 0 10 Oct 2025
SOFT: Selective Data Obfuscation for Protecting LLM Fine-tuning against Membership Inference Attacks Kaiyuan Zhang Siyuan Cheng Hanxi Guo Yuetian Chen Zian Su ... Yuntao Du Charles Fleming Jayanth Srinivasa Xiangyu Zhang Ninghui Li AAML 340 4 0 12 Jun 2025
When LLM Meets DRL: Advancing Jailbreaking Efficiency via DRL-guided SearchNeural Information Processing Systems (NeurIPS), 2024 Xuan Chen Yuzhou Nie Wenbo Guo Xiangyu Zhang 344 37 0 28 Jan 2025
DiffusionAttacker: Diffusion-Driven Prompt Manipulation for LLM Jailbreak Hao Wang Hao Li Junda Zhu Xinyuan Wang Changzai Pan Shiyu Huang Lei Sha 592 3 0 23 Dec 2024
Iterative Self-Tuning LLMs for Enhanced Jailbreaking CapabilitiesNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024 Chung-En Sun Xiaodong Liu Weiwei Yang Tsui-Wei Weng Hao Cheng Aidan San Michel Galley J. Gao 392 7 0 24 Oct 2024
Recent advancements in LLM Red-Teaming: Techniques, Defenses, and Ethical Considerations Tarun Raheja Nilay Pochhi AAML 185 7 0 09 Oct 2024
ASPIRER: Bypassing System Prompts With Permutation-based Backdoors in LLMs Lu Yan Siyuan Cheng Xuan Chen Kaiyuan Zhang Guangyu Shen Zhuo Zhang Xiangyu Zhang AAML SILM 170 1 0 05 Oct 2024
Operationalizing a Threat Model for Red-Teaming Large Language Models (LLMs) Apurv Verma Satyapriya Krishna Sebastian Gehrmann Madhavan Seshadri Anu Pradhan Tom Ault Leslie Barrett David Rabinowitz John Doucette Nhathai Phan 356 36 0 20 Jul 2024
Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs Javier Rando Francesco Croce Kryvstof Mitka Stepan Shabalin Maksym Andriushchenko Nicolas Flammarion F. Tramèr 175 23 0 22 Apr 2024