Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2508.14904
Cited By

Efficient Switchable Safety Control in LLMs via Magic-Token-Guided Co-Training

v1v2 (latest)

Efficient Switchable Safety Control in LLMs via Magic-Token-Guided Co-Training

12 August 2025

Xiangzheng Zhang

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)Github

Papers citing "Efficient Switchable Safety Control in LLMs via Magic-Token-Guided Co-Training"

1 / 1 papers shown

Inoculation Prompting: Instructing LLMs to misbehave at train-time improves test-time alignment

Inoculation Prompting: Instructing LLMs to misbehave at train-time improves test-time alignment

...

336

3

0

06 Oct 2025