Learning Compact Metrics for MT

12 October 2021

Papers citing "Learning Compact Metrics for MT"

25 / 75 papers shown

Title
Gender Biases in Automatic Evaluation Metrics for Image Captioning Haoyi Qiu Zi-Yi Dou Tianlu Wang Asli Celikyilmaz Nanyun Peng EGVM 11 8 0 24 May 2023
Sociocultural Norm Similarities and Differences via Situational Alignment and Explainable Textual Entailment Sky CH-Wang Arkadiy Saakyan Aochong Li Zhou Yu Smaranda Muresan 15 16 0 23 May 2023
A Suite of Generative Tasks for Multi-Level Multimodal Webpage Understanding Andrea Burns Krishna Srinivasan Joshua Ainslie Geoff Brown Bryan A. Plummer Kate Saenko Jianmo Ni Mandy Guo 3DV 26 10 0 05 May 2023
WangLab at MEDIQA-Chat 2023: Clinical Note Generation from Doctor-Patient Conversations using Large Language Models John Giorgi Ziang Ma Haitao Zhang Sondra S. Chen Kevin R. An Grace X. Zheng Jun Yin LM&MA AI4MH 33 9 0 03 May 2023
Learning Human-Human Interactions in Images from Weak Textual Supervision Morris Alper Hadar Averbuch-Elor VLM 37 2 0 27 Apr 2023
Fuzzy Alignments in Directed Acyclic Graph for Non-Autoregressive Machine Translation Zhengrui Ma Chenze Shao Shangtong Gui M. Zhang Yanghe Feng 20 14 0 12 Mar 2023
Learning Translation Quality Evaluation on Low Resource Languages from Large Language Models Amirkeivan Mohtashami M. Verzetti Paul Kishan Rubenstein 14 4 0 07 Feb 2023
BUMP: A Benchmark of Unfaithful Minimal Pairs for Meta-Evaluation of Faithfulness Metrics Liang Ma Shuyang Cao IV RobertL.Logan Di Lu Shihao Ran Kecheng Zhang Joel R. Tetreault A. Jaimes 8 6 0 20 Dec 2022
BLASER: A Text-Free Speech-to-Speech Translation Evaluation Metric Mingda Chen Paul-Ambroise Duquenne Pierre Yves Andrews Justine T. Kao Alexandre Mourachko Holger Schwenk Marta R. Costa-jussá 4 9 0 16 Dec 2022
Intriguing Properties of Compression on Multilingual Models Kelechi Ogueji Orevaoghene Ahia Gbemileke Onilude Sebastian Gehrmann Sara Hooker Julia Kreutzer 13 12 0 04 Nov 2022
Dialect-robust Evaluation of Generated Text Jiao Sun Thibault Sellam Elizabeth Clark Tu Vu Timothy Dozat Dan Garrette Aditya Siddhant Jacob Eisenstein Sebastian Gehrmann 13 19 0 02 Nov 2022
TaTa: A Multilingual Table-to-Text Dataset for African Languages Sebastian Gehrmann Sebastian Ruder Vitaly Nikolaev Jan A. Botha Michael Chavinda Ankur P. Parikh Clara E. Rivera LMTD 11 10 0 31 Oct 2022
BERTScore is Unfair: On Social Bias in Language Model-Based Metrics for Text Generation Tianxiang Sun Junliang He Xipeng Qiu Xuanjing Huang 14 44 0 14 Oct 2022
GLM-130B: An Open Bilingual Pre-trained Model Aohan Zeng Xiao Liu Zhengxiao Du Zihan Wang Hanyu Lai ... Jidong Zhai Wenguang Chen Peng-Zhen Zhang Yuxiao Dong Jie Tang BDL LRM 240 1,070 0 05 Oct 2022
Out-of-Distribution Detection and Selective Generation for Conditional Language Models Jie Jessie Ren Jiaming Luo Yao-Min Zhao Kundan Krishna Mohammad Saleh Balaji Lakshminarayanan Peter J. Liu OODD 64 92 0 30 Sep 2022
SuMe: A Dataset Towards Summarizing Biomedical Mechanisms Mohaddeseh Bastan N. Shankar Mihai Surdeanu Niranjan Balasubramanian 8 3 0 10 May 2022
Quality-Aware Decoding for Neural Machine Translation Patrick Fernandes António Farinhas Ricardo Rei José G. C. de Souza Perez Ogayo Graham Neubig André F. T. Martins 18 57 0 02 May 2022
TRUE: Re-evaluating Factual Consistency Evaluation Or Honovich Roee Aharoni Jonathan Herzig Hagai Taitelbaum Doron Kukliansy Vered Cohen Thomas Scialom Idan Szpektor Avinatan Hassidim Yossi Matias HILM 16 3 0 11 Apr 2022
PaLM: Scaling Language Modeling with Pathways Aakanksha Chowdhery Sharan Narang Jacob Devlin Maarten Bosma Gaurav Mishra ... Kathy Meier-Hellstern Douglas Eck J. Dean Slav Petrov Noah Fiedel PILM LRM 24 5,968 0 05 Apr 2022
Repairing the Cracked Foundation: A Survey of Obstacles in Evaluation Practices for Generated Text Sebastian Gehrmann Elizabeth Clark Thibault Sellam ELM AI4CE 45 182 0 14 Feb 2022
DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence Wei-Ye Zhao Michael Strube Steffen Eger 11 36 0 26 Jan 2022
SynthBio: A Case Study in Human-AI Collaborative Curation of Text Datasets Ann Yuan Daphne Ippolito Vitaly Nikolaev Chris Callison-Burch Andy Coenen Sebastian Gehrmann SyDa 104 17 0 11 Nov 2021
Evaluating Attribution in Dialogue Systems: The BEGIN Benchmark Nouha Dziri Hannah Rashkin Tal Linzen David Reitter ALM 185 79 0 30 Apr 2021
I-BERT: Integer-only BERT Quantization Sehoon Kim A. Gholami Z. Yao Michael W. Mahoney Kurt Keutzer MQ 86 332 0 05 Jan 2021
Rethinking embedding coupling in pre-trained language models Hyung Won Chung Thibault Févry Henry Tsai Melvin Johnson Sebastian Ruder 84 142 0 24 Oct 2020