Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2505.18003
Cited By

An Example Safety Case for Safeguards Against Misuse

An Example Safety Case for Safeguards Against Misuse

23 May 2025

ArXiv (abs)PDF HTML

Papers citing "An Example Safety Case for Safeguards Against Misuse"

2 / 2 papers shown

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming

Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming

Jorrit Kruthoff

...

429

96

0

31 Jan 2025

A sketch of an AI control safety case

A sketch of an AI control safety case

Benjamin Hilton

Geoffrey Irving

364

20

0

28 Jan 2025

Page 1 of 1