Amortizing intractable inference in large language models

Amortizing intractable inference in large language models

6 October 2023

Moksh Jain

Daniel Habermann

Younesse Kaddar

Stefan T. Radev

Nikolay Malkin

Papers citing "Amortizing intractable inference in large language models"

17 / 17 papers shown

Title
Accurate and Diverse LLM Mathematical Reasoning via Automated PRM-Guided GFlowNets Adam Younsi Abdalgader Abubaker M. Seddik Hakim Hacid Salem Lahlou LRM 54 0 0 28 Apr 2025
Less is More: Adaptive Program Repair with Bug Localization and Preference Learning Zhenlong Dai Bingrui Chen Zhuoluo Zhao Xiu Tang Sai Wu Chang Yao Zhipeng Gao Jingyuan Chen KELM 27 1 0 09 Mar 2025
Scaling Diffusion Language Models via Adaptation from Autoregressive Models Shansan Gong Shivam Agarwal Yizhe Zhang Jiacheng Ye Lin Zheng ... Peilin Zhao W. Bi Jiawei Han Hao Peng Lingpeng Kong AI4CE 52 14 0 23 Oct 2024
A Complexity-Based Theory of Compositionality Eric Elmoznino Thomas Jiralerspong Yoshua Bengio Guillaume Lajoie CoGe 50 3 0 18 Oct 2024
Adaptive teachers for amortized samplers Minsu Kim Sanghyeok Choi Taeyoung Yun Emmanuel Bengio Leo Feng Jarrid Rector-Brooks Sungsoo Ahn Jinkyoo Park Nikolay Malkin Yoshua Bengio 33 2 0 02 Oct 2024
Embarrassingly Parallel GFlowNets Tiago da Silva Luiz Max Carvalho Amauri Souza Samuel Kaski Diego Mesquita 26 1 0 05 Jun 2024
Amortizing intractable inference in diffusion models for vision, language, and control S. Venkatraman Moksh Jain Luca Scimeca Minsu Kim Marcin Sendera ... Alexandre Adam Jarrid Rector-Brooks Yoshua Bengio Glen Berseth Nikolay Malkin 54 24 0 31 May 2024
Learning diverse attacks on large language models for robust red-teaming and safety tuning Seanie Lee Minsu Kim Lynn Cherif David Dobre Juho Lee ... Kenji Kawaguchi Gauthier Gidel Yoshua Bengio Nikolay Malkin Moksh Jain AAML 42 12 0 28 May 2024
BWArea Model: Learning World Model, Inverse Dynamics, and Policy for Controllable Language Generation Chengxing Jia Pengyuan Wang Ziniu Li Yi-Chen Li Zhilong Zhang Nan Tang Yang Yu OffRL 20 1 0 27 May 2024
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models Yu Feng Ben Zhou Weidong Lin Dan Roth 49 4 0 18 Apr 2024
GFlowNets and variational inference Nikolay Malkin Salem Lahlou T. Deleu Xu Ji J. E. Hu Katie Everett Dinghuai Zhang Yoshua Bengio BDL 127 77 0 02 Oct 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 291 2,712 0 24 May 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 297 3,163 0 21 Mar 2022
Trajectory balance: Improved credit assignment in GFlowNets Nikolay Malkin Moksh Jain Emmanuel Bengio Chen Sun Yoshua Bengio 142 165 0 31 Jan 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022
Language Models as Knowledge Bases? Fabio Petroni Tim Rocktaschel Patrick Lewis A. Bakhtin Yuxiang Wu Alexander H. Miller Sebastian Riedel KELM AI4MH 391 2,216 0 03 Sep 2019
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Z. Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 716 6,435 0 26 Sep 2016