Token-level Proximal Policy Optimization for Query Generation

Token-level Proximal Policy Optimization for Query Generation

1 November 2024

Chenghua Huang

Yaming Yang

Saravan Rajmohan

Papers citing "Token-level Proximal Policy Optimization for Query Generation"

1 / 1 papers shown

Title
Fine-Grained Reward Optimization for Machine Translation using Error Severity Mappings Miguel Moura Ramos Tomás Almeida Daniel Vareta Filipe Azevedo Sweta Agrawal Patrick Fernandes André F. T. Martins 31 1 0 08 Nov 2024