There's No Comparison: Reference-less Evaluation Metrics in Grammatical Error Correction

Conference on Empirical Methods in Natural Language Processing (EMNLP), 2016

7 October 2016

Courtney Napoles

Keisuke Sakaguchi

Joel R. Tetreault

ArXiv (abs)PDF HTML

Papers citing "There's No Comparison: Reference-less Evaluation Metrics in Grammatical Error Correction"

31 / 31 papers shown

Introducing OmniGEC: A Silver Multilingual Dataset for Grammatical Error Correction

121

18 Sep 2025

Differentially-private text generation degrades output language quality

Erion Cano

Ivan Habernal

SyDa

14 Sep 2025

Opportunities and Challenges of LLMs in Education: An NLP Perspective

249

30 Jul 2025

Advancements in Arabic Grammatical Error Detection and Correction: An Empirical InvestigationConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

175

24 May 2023

CLEME: Debiasing Multi-reference Evaluation for Grammatical Error CorrectionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

309

18 May 2023

How to choose "Good" Samples for Text Data Augmentation

194

02 Feb 2023

Grammatical Error Correction: A Survey of the State of the ArtComputational Linguistics (CL), 2022

Hwee Tou Ng

247

113

09 Nov 2022

Revisiting Grammatical Error Correction Evaluation and BeyondConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Peiyuan Gong

Xuebo Liu

Heyan Huang

Min Zhang

174

03 Nov 2022

Universal Evasion Attacks on Summarization ScoringBlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP (BlackboxNLP), 2022

Wenchuan Mu

Kwan Hui Lim

AAML

217

25 Oct 2022

Towards Automated Document Revision: Grammatical Error Correction, Fluency Edits, and BeyondWorkshop on Innovative Use of NLP for Building Educational Applications (UNBEA), 2022

Keisuke Sakaguchi

132

23 May 2022

Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error CorrectionInternational Conference on Language Resources and Evaluation (LREC), 2022

20 Jan 2022

LM-Critic: Language Models for Unsupervised Grammatical Error Correction

Michihiro Yasunaga

J. Leskovec

Abigail Z. Jacobs

187

14 Sep 2021

SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality AnalysisAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Joshua Forster Feinglass

Yezhou Yang

02 Jun 2021

On the Use of Linguistic Features for the Evaluation of Generative Dialogue Systems

Ian Berlot-Attwell

Frank Rudzicz

13 Apr 2021

Assessing Reference-Free Peer Evaluation for Machine TranslationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

Colin Cherry

133

12 Apr 2021

Evaluating the Morphosyntactic Well-formedness of Generated TextsConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Adithya Pratapa

Antonios Anastasopoulos

Graham Neubig

152

30 Mar 2021

A Comprehensive Survey of Grammar Error Correction

215

02 May 2020

BLEU Neighbors: A Reference-less Approach to Automatic Evaluation

Kawin Ethayarajh

Dorsa Sadigh

164

27 Apr 2020

Towards Minimal Supervision BERT-based Grammar Error CorrectionAAAI Conference on Artificial Intelligence (AAAI), 2020

Yiyuan Li

Antonios Anastasopoulos

A. Black

10 Jan 2020

Diamonds in the Rough: Generating Fluent Sentences from Early-Stage Drafts for Academic Writing AssistanceInternational Conference on Natural Language Generation (INLG), 2019

146

21 Oct 2019

Automatic Quality Estimation for Natural Language Generation: Ranting (Jointly Rating and Ranking)International Conference on Natural Language Generation (INLG), 2019

141

10 Oct 2019

On conducting better validation studies of automatic metrics in natural language generation evaluation

Johnny Tian-Zheng Wei

123

31 Jul 2019

An Analysis of Source-Side Grammatical Errors in NMT

Antonios Anastasopoulos

101

24 May 2019

Reaching Human-level Performance in Automatic Grammatical Error Correction: An Empirical Study

Tao Ge

Furu Wei

M. Zhou

353

03 Jul 2018

Inherent Biases in Reference based Evaluation for Grammatical Error Correction and Text Simplification

Leshem Choshen

Omri Abend

161

30 Apr 2018

Automatic Metric Validation for Grammatical Error Correction

Leshem Choshen

Omri Abend

143

30 Apr 2018

Reference-less Measure of Faithfulness for Grammatical Error Correction

Leshem Choshen

Omri Abend

3DV

136

11 Apr 2018

Dear Sir or Madam, May I introduce the GYAFC Dataset: Corpus, Benchmarks and Metrics for Formality Style Transfer

Sudha Rao

Joel R. Tetreault

253

422

17 Mar 2018

Referenceless Quality Estimation for Natural Language Generation

Ondrej Dusek

Jekaterina Novikova

Verena Rieser

170

05 Aug 2017

Why We Need New Evaluation Metrics for NLG

Jekaterina Novikova

Ondrej Dusek

Amanda Cercas Curry

Verena Rieser

211

491

21 Jul 2017

Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning

318

192

10 Apr 2017