Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization

Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization

25 April 2025

Wataru Kawakami

Junichiro Iwasawa

Papers citing "Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization"

Title
No papers