v1v2 (latest)

Self-Refine: Iterative Refinement with Self-Feedback

Neural Information Processing Systems (NeurIPS), 2023

30 March 2023

Bodhisattwa Prasad Majumder

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "Self-Refine: Iterative Refinement with Self-Feedback"

50 / 1,674 papers shown

Autonomous LLM-driven research from data to human-verifiable research papers

300

24 Apr 2024

Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs

Julian McAuley

Shuai Li

LRM

648

24 Apr 2024

Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation

Xun Wu

Shaohan Huang

Furu Wei

208

23 Apr 2024

NExT: Teaching Large Language Models to Reason about Code Execution

Ansong Ni

Miltiadis Allamanis

Arman Cohan

Yinlin Deng

270

23 Apr 2024

Achieving >97% on GSM8K: Deeply Understanding the Problems Makes LLMs Better Solvers for Math Word Problems

Bo Du

496

23 Apr 2024

A Survey on Self-Evolution of Large Language Models

Ting-En Lin

Fei Huang

Jingren Zhou

302

22 Apr 2024

ISQA: Informative Factuality Feedback for Scientific Summarization

242

20 Apr 2024

iTBLS: A Dataset of Interactive Conversations Over Tabular Information

Anirudh S. Sundar

Christopher Richardson

William Gay

Larry Heck

LMTD

355

19 Apr 2024

Who Validates the Validators? Aligning LLM-Assisted Evaluation of LLM Outputs with Human Preferences

Shreya Shankar

J.D. Zamfirescu-Pereira

Bjorn Hartmann

Aditya G. Parameswaran

Ian Arawjo

ALM

245

180

18 Apr 2024

Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing

Linfeng Song

Dian Yu

Dong Yu

261

124

18 Apr 2024

Large Language Models Can Solve Real-World Planning Rigorously with Formal Verification Tools

Chuchu Fan

286

18 Apr 2024

Enhancing Q&A with Domain-Specific Fine-Tuning and Iterative Reasoning: A Comparative Study

157

17 Apr 2024

AgentKit: Flow Engineering with Graphs, not Coding

337

17 Apr 2024

Can Language Models Solve Olympiad Programming?

334

16 Apr 2024

Reinforcement Learning from Multi-role Debates as Feedback for Bias Mitigation in LLMs

437

15 Apr 2024

LLM Evaluators Recognize and Favor Their Own Generations

Arjun Panickssery

Samuel R. Bowman

Shi Feng

411

348

15 Apr 2024

Distilling Reasoning Ability from Large Language Models with Adaptive Thinking

314

14 Apr 2024

When Hindsight is Not 20/20: Testing Limits on Reflective Thinking in Large Language Models

156

14 Apr 2024

Confidence Calibration and Rationalization for LLMs via Multi-Agent Deliberation

496

14 Apr 2024

RLHF Deciphered: A Critical Analysis of Reinforcement Learning from Human Feedback for LLMs

Bruno Castro da Silva

407

12 Apr 2024

Online Safety Analysis for LLMs: a Benchmark, an Assessment, and a Path Forward

385

12 Apr 2024

Auctions with LLM Summaries

170

11 Apr 2024

Guiding Large Language Models to Post-Edit Machine Translation with Error Annotations

Dayeon Ki

Marine Carpuat

284

11 Apr 2024

ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

379

104

11 Apr 2024

CodecLM: Aligning Language Models with Tailored Synthetic Data

Chun-Liang Li

Chen-Yu Lee

Tomas Pfister

SyDa ALM

194

08 Apr 2024

RoT: Enhancing Large Language Models with Reflection on Search Trees

Wenyang Hui

Kewei Tu

LRM

241

08 Apr 2024

Idea-2-3D: Collaborative LMM Agents Enable 3D Model Generation from Interleaved Multimodal Inputs

Xiang Li

Hao Zhao

400

05 Apr 2024

SELF-[IN]CORRECT: LLMs Struggle with Refining Self-Generated ResponsesAAAI Conference on Artificial Intelligence (AAAI), 2024

Dongwei Jiang

Jingyu Zhang

Orion Weller

Nathaniel Weir

Benjamin Van Durme

Daniel Khashabi

226

04 Apr 2024

Evaluating LLMs at Detecting Errors in LLM Responses

Ryo Kamoi

Sarkar Snigdha Sarathi Das

...

Arman Cohan

217

04 Apr 2024

Personalized LLM Response Generation with Parameterized Memory Injection

Kai Zhang

Lizhi Qing

Yangyang Kang

348

04 Apr 2024

Empowering Biomedical Discovery with AI AgentsCell (Cell), 2024

Shanghua Gao

Ada Fang

Yepeng Huang

Valentina Giunchiglia

Ayush Noori

Jonathan Richard Schwarz

267

208

03 Apr 2024

Self-Organized Agents: A LLM Multi-Agent Framework toward Ultra Large-Scale Code Generation and Optimization

Yoichi Ishibashi

Yoshimasa Nishimura

240

02 Apr 2024

A Survey on Large Language Model-Based Game Agents

AI4CE LLMAG LM&Ro LM&MA

680

107

02 Apr 2024

Large Language Models are Capable of Offering Cognitive Reappraisal, if Guided

256

01 Apr 2024

Self-Demos: Eliciting Out-of-Demonstration Generalizability in Large Language Models

Xuanjing Huang

183

01 Apr 2024

Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods

LLMAG KELM OffRL LM&Ro

405

151

30 Mar 2024

Conceptual and Unbiased Reasoning in Language Models

Dian Yu

Dong Yu

262

30 Mar 2024

Can LLMs Learn from Previous Mistakes? Investigating LLMs' Errors to Boost for Reasoning

411

29 Mar 2024

Enhancing the General Agent Capabilities of Low-Parameter LLMs through Tuning and Multi-Branch Reasoning

176

29 Mar 2024

MATEval: A Multi-Agent Discussion Framework for Advancing Open-Ended Text Evaluation

Yu Li

172

28 Mar 2024

Learning From Correctness Without Prompting Makes LLM Efficient Reasoner

Han Wu

Jiahui Gao

Linqi Song

342

28 Mar 2024

CYCLE: Learning to Self-Refine the Code Generation

243

27 Mar 2024

IterAlign: Iterative Constitutional Alignment of Large Language Models

117

27 Mar 2024

Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation

230

25 Mar 2024

LLM2LLM: Boosting LLMs with Novel Iterative Data EnhancementAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Nicholas Lee

Thanakul Wattanawong

Sehoon Kim

K. Mangalam

Sheng Shen

Gopala Anumanchipalli

Michael W. Mahoney

Kurt Keutzer

A. Gholami

292

22 Mar 2024

A Picture Is Worth a Graph: Blueprint Debate on Graph for Multimodal ReasoningACM Multimedia (MM), 2024

207

22 Mar 2024

Reinforcement Learning from Reflective Feedback (RLRF): Aligning and Improving LLMs via Fine-Grained Self-Reflection

265

21 Mar 2024

VURF: A General-purpose Reasoning and Self-refinement Framework for Video Understanding

Ahmad A Mahmood

Ashmal Vayani

Muzammal Naseer

Salman Khan

Fahad Shahbaz Khan

LRM

419

21 Mar 2024

Facilitating Pornographic Text Detection for Open-Domain Dialogue Systems via Knowledge Distillation of Large Language Models

234

20 Mar 2024

Dr3: Ask Large Language Models Not to Give Off-Topic Answers in Open Domain Multi-Hop Question AnsweringInternational Conference on Language Resources and Evaluation (LREC), 2024

216

19 Mar 2024