Self-Evaluation as a Defense Against Adversarial Attacks on LLMs

3 July 2024

Papers citing "Self-Evaluation as a Defense Against Adversarial Attacks on LLMs"

2 / 2 papers shown

Title
ETA: Evaluating Then Aligning Safety of Vision Language Models at Inference Time Yi Ding Bolian Li Ruqi Zhang MLLM 67 5 0 09 Oct 2024
Self-Evaluation Guided Beam Search for Reasoning Yuxi Xie Kenji Kawaguchi Yiran Zhao Xu Zhao MingSung Kan Junxian He Qizhe Xie LRM 164 128 0 01 May 2023