Reward Optimization for Neural Machine Translation with Learned Metrics

15 April 2021

Raphael Shu

Kang Min Yoo

Jung-Woo Ha

ArXiv (abs)PDF HTML Github (25★)

Papers citing "Reward Optimization for Neural Machine Translation with Learned Metrics"

13 / 13 papers shown

Reward Models are Metrics in a Trench Coat

Sebastian Gehrmann

188

03 Oct 2025

Adding Chocolate to Mint: Mitigating Metric Interference in Machine Translation

451

11 Mar 2025

Segmenting Text and Learning Their Rewards for Improved RLHF in Language Model

402

07 Jan 2025

LLM See, LLM Do: Guiding Data Generation to Target Non-Differentiable Objectives

Sara Hooker

426

01 Jul 2024

A Dense Reward View on Aligning Text-to-Image Diffusion with Preference

Shentao Yang

Tianqi Chen

Mingyuan Zhou

EGVM

482

13 Feb 2024

Learning Evaluation Models from Large Language Models for Sequence Generation

745

08 Aug 2023

ESRL: Efficient Sampling-based Reinforcement Learning for Sequence GenerationAAAI Conference on Artificial Intelligence (AAAI), 2023

Jingbo Zhu

293

04 Aug 2023

Preference-grounded Token-level Guidance for Language Model Fine-tuningNeural Information Processing Systems (NeurIPS), 2023

564

01 Jun 2023

GROOT: Corrective Reward Optimization for Generative Sequential Labeling

Kazuma Hashimoto

K. Raman

VLM

462

29 Sep 2022

Repairing the Cracked Foundation: A Survey of Obstacles in Evaluation Practices for Generated TextJournal of Artificial Intelligence Research (JAIR), 2022

780

230

14 Feb 2022

Learning Compact Metrics for MTConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

276

113

12 Oct 2021

Doubly-Trained Adversarial Data Augmentation for Neural Machine TranslationConference of the Association for Machine Translation in the Americas (AMTA), 2021

232

12 Oct 2021

Convergence Properties of Stochastic HypergradientsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

Riccardo Grazzi

Massimiliano Pontil

Saverio Salzo

617

13 Nov 2020