Measuring and Narrowing the Compositionality Gap in Language Models

7 October 2022

Ofir Press

Papers citing "Measuring and Narrowing the Compositionality Gap in Language Models"

50 / 419 papers shown

Title
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? Yutong Yin Zhaoran Wang LRM ReLM 43 0 0 27 Jan 2025
Chain-of-Retrieval Augmented Generation Liang Wang Haonan Chen Nan Yang Xiaolong Huang Zhicheng Dou Furu Wei RALM LRM ReLM 3DV 75 6 0 24 Jan 2025
Zero-shot and Few-shot Learning with Instruction-following LLMs for Claim Matching in Automated Fact-checking Dina Pisarevskaya Arkaitz Zubiaga 48 0 0 18 Jan 2025
Can ChatGPT Overcome Behavioral Biases in the Financial Sector? Classify-and-Rethink: Multi-Step Zero-Shot Reasoning in the Gold Investment Shuoling Liu Gaoguo Jia Yuhang Jiang Liyuan Chen Qiang Yang AIFin LRM 89 0 0 17 Jan 2025
LLMs Model Non-WEIRD Populations: Experiments with Synthetic Cultural Agents Augusto Gonzalez-Bonorino Monica Capra Emilio Pantoja 33 1 0 12 Jan 2025
LLMs as Workers in Human-Computational Algorithms? Replicating Crowdsourcing Pipelines with LLMs Tongshuang Wu Haiyi Zhu Maya Albayrak Alexis Axon Amanda Bertsch ... Ying-Jui Tseng Patricia Vaidos Zhijin Wu Wei Yu Wu Chenyang Yang 61 27 0 10 Jan 2025
What Matters for In-Context Learning: A Balancing Act of Look-up and In-Weight Learning Jelena Bratulić Sudhanshu Mittal Christian Rupprecht Thomas Brox 34 0 0 09 Jan 2025
A Survey of Calibration Process for Black-Box LLMs Liangru Xie Hui Liu Jingying Zeng Xianfeng Tang Yan Han Chen Luo Jing Huang Zhen Li Suhang Wang Qi He 74 1 0 17 Dec 2024
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation X. Li Jiajie Jin Yujia Zhou Yongkang Wu Zhonghua Li Qi Ye Zhicheng Dou RALM LRM 100 5 0 16 Dec 2024
Let your LLM generate a few tokens and you will reduce the need for retrieval Hervé Déjean 73 0 0 16 Dec 2024
Thinking with Knowledge Graphs: Enhancing LLM Reasoning Through Structured Data Xue Wu Kostas Tsioutsiouliklis 57 0 0 14 Dec 2024
Chain-of-Thought in Large Language Models: Decoding, Projection, and Activation H. Yang Qianghua Zhao Lei Li AI4CE LRM 66 1 0 05 Dec 2024
Theoretical limitations of multi-layer Transformer Lijie Chen Binghui Peng Hongxun Wu AI4CE 67 6 0 04 Dec 2024
Towards Adaptive Mechanism Activation in Language Agent Ziyang Huang Jun Zhao Kang-Jun Liu LLMAG AI4CE 73 0 0 01 Dec 2024
Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts? Sohee Yang Nora Kassner E. Gribovskaya Sebastian Riedel Mor Geva KELM LRM ReLM 75 4 0 25 Nov 2024
$The Two-Hop Curse: LLMs trained on A$\rightarrow$B, B$\rightarrow$C fail to learn A$\rightarrow$C$ The Two-Hop Curse: LLMs trained on A $\rightarrow$ B, B $\rightarrow$ C fail to learn A $\rightarrow$ C Mikita Balesni Tomek Korbak Owain Evans ReLM LRM 79 0 0 25 Nov 2024
AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning Amy Xin Jinxin Liu Zijun Yao Zhicheng Li S. Cao Lei Hou Juanzi Li LRM 89 1 0 25 Nov 2024
AssistRAG: Boosting the Potential of Large Language Models with an Intelligent Information Assistant Yujia Zhou Zheng Liu Zhicheng Dou AIFin LRM RALM 21 2 0 11 Nov 2024
EXPLORA: Efficient Exemplar Subset Selection for Complex Reasoning Kiran Purohit Venktesh V Raghuram Devalla Krishna Mohan Yerragorla Sourangshu Bhattacharya Avishek Anand LRM 25 0 0 06 Nov 2024
Grounding by Trying: LLMs with Reinforcement Learning-Enhanced Retrieval Sheryl Hsu Omar Khattab Chelsea Finn Archit Sharma KELM RALM 28 5 0 30 Oct 2024
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models Tanmay Parekh Pradyot Prakash Alexander Radovic Akshay Shekher Denis Savenkov LRM 44 1 0 30 Oct 2024
Reasoning or a Semblance of it? A Diagnostic Study of Transitive Reasoning in LLMs Houman Mehrafarin Arash Eshghi Ioannis Konstas LRM 18 0 0 26 Oct 2024
EVA: An Embodied World Model for Future Video Anticipation Xiaowei Chi Hengyuan Zhang Chun-Kai Fan Xingqun Qi Rongyu Zhang ... Chi-Min Chan Wei Xue Wenhan Luo Shanghang Zhang Yike Guo VGen 30 4 0 20 Oct 2024
SPRIG: Improving Large Language Model Performance by System Prompt Optimization Lechen Zhang Tolga Ergen Lajanugen Logeswaran Moontae Lee David Jurgens LRM 37 7 0 18 Oct 2024
FinQAPT: Empowering Financial Decisions with End-to-End LLM-driven Question Answering Pipeline Kuldeep Singh Simerjot Kaur Charese Smiley AIFin 18 2 0 17 Oct 2024
Breaking Chains: Unraveling the Links in Multi-Hop Knowledge Unlearning Minseok Choi C. Park Dohyun Lee Jaegul Choo KELM MU 26 1 0 17 Oct 2024
AT-RAG: An Adaptive RAG Model Enhancing Query Efficiency with Topic Filtering and Iterative Reasoning Mohammad Reza Rezaei Maziar Hafezi Amit Satpathy Lovell Hodge Ebrahim Pourjafari 18 2 0 16 Oct 2024
Facilitating Multi-turn Function Calling for LLMs via Compositional Instruction Tuning Mingyang Chen Haoze Sun Tianpeng Li Fan Yang Hao Liang Keer Lu Bin Cui Wentao Zhang Zenan Zhou Weipeng Chen LRM 44 5 0 16 Oct 2024
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering Zhongwu Chen Chengjin Xu Dingmin Wang Zhen Huang Yong Dou Xuhui Jiang Jian Guo RALM 71 1 0 15 Oct 2024
SuperCorrect: Advancing Small LLM Reasoning with Thought Template Distillation and Self-Correction L. Yang Zhaochen Yu T. Zhang Minkai Xu Joseph E. Gonzalez Bin Cui Shuicheng Yan ELM ReLM LRM 44 0 0 11 Oct 2024
Understanding the Interplay between Parametric and Contextual Knowledge for Large Language Models Sitao Cheng Liangming Pan Xunjian Yin Xinyi Wang William Yang Wang KELM 30 3 0 10 Oct 2024
AgentBank: Towards Generalized LLM Agents via Fine-Tuning on 50000+ Interaction Trajectories Yifan Song Weimin Xiong Xiutian Zhao Dawei Zhu Wenhao Wu Ke Wang Cheng Li Wei Peng Sujian Li LLMAG 21 9 0 10 Oct 2024
Divide and Translate: Compositional First-Order Logic Translation and Verification for Complex Logical Reasoning Hyun Ryu Gyeongman Kim Hyemin S. Lee Eunho Yang LRM 31 3 0 10 Oct 2024
Exploring Prompt Engineering: A Systematic Review with SWOT Analysis Aditi Singh Abul Ehtesham Gaurav Kumar Gupta Nikhil Kumar Chatta Saket Kumar T. T. Khoei 28 1 0 09 Oct 2024
Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context Sangwon Yu Ik-hwan Kim Jongyoon Song Saehyung Lee Junsung Park Sungroh Yoon LRM 65 0 0 09 Oct 2024
Retrieving, Rethinking and Revising: The Chain-of-Verification Can Improve Retrieval Augmented Generation Bolei He Nuo Chen Xinran He Lingyong Yan Zhenkai Wei Jinchang Luo Zhen-Hua Ling RALM LRM 18 1 0 08 Oct 2024
Rationale-Aware Answer Verification by Pairwise Self-Evaluation Akira Kawabata Saku Sugawara LRM 28 2 0 07 Oct 2024
Accelerating Inference of Networks in the Frequency Domain Chenqiu Zhao Guanfang Dong Anup Basu 33 10 0 06 Oct 2024
Open-RAG: Enhanced Retrieval-Augmented Reasoning with Open-Source Large Language Models Shayekh Bin Islam Md Asib Rahman K S M Tozammel Hossain Enamul Hoque Shafiq R. Joty Md. Rizwan Parvez RALM AIFin LRM VLM 32 12 0 02 Oct 2024
Not All LLM Reasoners Are Created Equal Arian Hosseini Alessandro Sordoni Daniel Toyama Aaron C. Courville Rishabh Agarwal LRM 33 11 0 02 Oct 2024
Can We Further Elicit Reasoning in LLMs? Critic-Guided Planning with Retrieval-Augmentation for Solving Challenging Tasks Xingxuan Li Weiwen Xu Ruochen Zhao Fangkai Jiao Shafiq R. Joty Lidong Bing LRM 37 8 0 02 Oct 2024
Geometric Signatures of Compositionality Across a Language Model's Lifetime Jin Hwa Lee Thomas Jiralerspong Lei Yu Yoshua Bengio Emily Cheng CoGe 82 0 0 02 Oct 2024
PyRIT: A Framework for Security Risk Identification and Red Teaming in Generative AI System Gary D. Lopez Munoz Amanda Minnich Roman Lutz Richard Lundeen Raja Sekhar Rao Dheekonda ... Tori Westerhoff Chang Kawaguchi Christian Seifert Ram Shankar Siva Kumar Yonatan Zunger SILM 16 8 0 01 Oct 2024
Can Models Learn Skill Composition from Examples? Haoyu Zhao Simran Kaur Dingli Yu Anirudh Goyal Sanjeev Arora CoGe MoE 48 2 0 29 Sep 2024
Zero-Shot Multi-Hop Question Answering via Monte-Carlo Tree Search with Large Language Models Seongmin Lee Jaewook Shin Youngjin Ahn Seokin Seo Ohjoon Kwon Kee-Eung Kim LRM 11 0 0 28 Sep 2024
A Survey on the Honesty of Large Language Models Siheng Li Cheng Yang Taiqiang Wu Chufan Shi Yuji Zhang ... Jie Zhou Yujiu Yang Ngai Wong Xixin Wu Wai Lam HILM 27 4 0 27 Sep 2024
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely Siyun Zhao Yuqing Yang Zilong Wang Zhiyuan He Luna Qiu Lili Qiu SyDa RALM 3DV 32 31 0 23 Sep 2024
Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning Jiaxin Wen Jian Guan Hongning Wang Wei Wu Minlie Huang ReLM OffRL LRM 26 7 0 19 Sep 2024
Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation Chen Liang Zhifan Feng Zihe Liu Wenbin Jiang Jinan Xu Yufeng Chen Yong Wang LLMAG LRM 18 0 0 19 Sep 2024
Trustworthiness in Retrieval-Augmented Generation Systems: A Survey Yujia Zhou Yan Liu Xiaoxi Li Jiajie Jin Hongjin Qian Zheng Liu Chaozhuo Li Zhicheng Dou Tsung-Yi Ho Philip S. Yu 3DV RALM 43 22 0 16 Sep 2024