Title
Activated LoRA: Fine-tuned LLMs for Intrinsics Kristjan Greenewald Luis A. Lastras Thomas Parnell Vraj Shah Lucian Popa Giulio Zizzo Chulaka Gunasekara Ambrish Rawat David D. Cox 22 0 0 16 Apr 2025
Building Safe GenAI Applications: An End-to-End Overview of Red Teaming for Large Language Models Alberto Purpura Sahil Wadhwa Jesse Zymet Akshay Gupta Andy Luo Melissa Kazemi Rad Swapnil Shinde Mohammad Sorower AAML 61 0 0 03 Mar 2025
Lessons From Red Teaming 100 Generative AI Products Blake Bullwinkel Amanda Minnich Shiven Chawla Gary Lopez Martin Pouliot ... Pete Bryan Ram Shankar Siva Kumar Yonatan Zunger Chang Kawaguchi Mark Russinovich AAML VLM 37 4 0 13 Jan 2025
Hey GPT, Can You be More Racist? Analysis from Crowdsourced Attempts to Elicit Biased Content from Generative AI Hangzhi Guo Pranav Narayanan Venkit Eunchae Jang Mukund Srinath Wenbo Zhang Bonam Mingole Vipul Gupta Kush R. Varshney S. Shyam Sundar A. Yadav 27 3 0 20 Oct 2024