The GEM Benchmark: Natural Language Generation, its Evaluation and
Metrics

The GEM Benchmark: Natural Language Generation, its Evaluation and Metrics

2 February 2021

Sebastian Gehrmann

Tosin P. Adewumi

Karmanya Aggarwal

Pawan Sasanka Ammanamanchi

Aremu Anuoluwapo

Antoine Bosselut

Khyathi Raghavi Chandu

Kaustubh D. Dhole

Esin Durmus

Chris C. Emezue

Cristina Garbacea

Tatsunori Hashimoto

Mounica Maddela

Bodhisattwa Prasad Majumder

Pedro Henrique Martins

Angelina McMillan-Major

Simon Mille

Emiel van Miltenburg

Vitaly Nikolaev

Andre Niyongabo Rubungo

Ankur P. Parikh

Laura Perez-Beltrachini

Juan Diego Rodriguez

Sashank Santhanam

Thibault Sellam

Anastasia Shimorina

Marco Antonio Sobrevilla Cabezudo

Hendrik Strobelt

Nishant Subramani

Diyi Yang

Akhila Yerukola

Papers citing "The GEM Benchmark: Natural Language Generation, its Evaluation and Metrics"

5 / 5 papers shown

Title
DynaSent: A Dynamic Benchmark for Sentiment Analysis Christopher Potts Zhengxuan Wu Atticus Geiger Douwe Kiela 192 67 0 30 Dec 2020
GO FIGURE: A Meta Evaluation of Factuality in Summarization Saadia Gabriel Asli Celikyilmaz Rahul Jha Yejin Choi Jianfeng Gao HILM 195 80 0 24 Oct 2020
How Can We Accelerate Progress Towards Human-like Linguistic Generalization? Tal Linzen 188 176 0 03 May 2020
MLQA: Evaluating Cross-lingual Extractive Question Answering Patrick Lewis Barlas Oğuz Ruty Rinott Sebastian Riedel Holger Schwenk ELM 204 434 0 16 Oct 2019
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 267 6,003 0 20 Apr 2018