v1v2v3 (latest)

Improving language models by retrieving from trillions of tokens

8 December 2021

George van den Driessche

Jean-Baptiste Lespiau

Saffron Huang

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "Improving language models by retrieving from trillions of tokens"

50 / 893 papers shown

Contextual Document EmbeddingsInternational Conference on Learning Representations (ICLR), 2024

John X. Morris

Alexander M. Rush

516

03 Oct 2024

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

Vinayak Arannil

Neha Narwal

Sourav Sanjukta Bhabesh

299

30 Sep 2024

FaithEval: Can Your Language Model Stay Faithful to Context, Even If "The Moon is Made of Marshmallows"International Conference on Learning Representations (ICLR), 2024

631

30 Sep 2024

Does RAG Introduce Unfairness in LLMs? Evaluating Fairness in Retrieval-Augmented Generation SystemsInternational Conference on Computational Linguistics (COLING), 2024

512

29 Sep 2024

Enhancing Post-Hoc Attributions in Long Document Comprehension via Coarse Grained Answer DecompositionConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Pritika Ramu

Koustava Goswami

Apoorv Saxena

Balaji Vasan Srinivavsan

290

25 Sep 2024

Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting FrameworkConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Jiafeng Guo

150

24 Sep 2024

Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely

Siyun Zhao

Yuqing Yang

Zilong Wang

Zhiyuan He

Luna Qiu

Lili Qiu

SyDa RALM 3DV

322

23 Sep 2024

MMSearch: Benchmarking the Potential of Large Models as Multi-modal Search Engines

Renrui Zhang

...

Guanglu Song

Peng Gao

Yu Liu

Chunyuan Li

Hongsheng Li

MLLM

287

19 Sep 2024

FoodPuzzle: Developing Large Language Model Agents as Flavor Scientists

Tenghao Huang

Muhao Chen

350

19 Sep 2024

RAG-Modulo: Solving Sequential Tasks using Experience, Critics, and Language Models

Abhinav Jain

Chris Jermaine

Vaibhav Unhelkar

KELM LLMAG

206

18 Sep 2024

Trustworthiness in Retrieval-Augmented Generation Systems: A Survey

Yan Liu

Zheng Liu

Tsung-Yi Ho

281

16 Sep 2024

Retro-li: Small-Scale Retrieval Augmented Generation Supporting Noisy Similarity Searches and Domain Shift GeneralizationEuropean Conference on Artificial Intelligence (ECAI), 2024

Abu Sebastian

543

12 Sep 2024

On the Vulnerability of Applying Retrieval-Augmented Generation within Knowledge-Intensive Application Domains

280

12 Sep 2024

Column Vocabulary Association (CVA): semantic interpretation of dataless tables

Jacco van Ossenbruggen

177

06 Sep 2024

You Only Use Reactive Attention Slice For Long Context Retrieval

214

03 Sep 2024

A Learnable Agent Collaboration Network Framework for Personalized Multimodal AI Search Engine

Min Xu

Qiang Wu

209

01 Sep 2024

Retrieval-Augmented Natural Language Reasoning for Explainable Visual Question Answering

197

30 Aug 2024

Enhancing and Accelerating Large Language Models via Instruction-Aware Contextual Compression

Haowen Hou

Fei Ma

Binwen Bai

Xinxin Zhu

Fei Yu

200

28 Aug 2024

A Statistical Framework for Data-dependent Retrieval-Augmented ModelsInternational Conference on Machine Learning (ICML), 2024

Soumya Basu

A. S. Rawat

Manzil Zaheer

RALM

282

27 Aug 2024

Ancient Wisdom, Modern Tools: Exploring Retrieval-Augmented LLMs for Ancient Indian Philosophy

Priyanka Mandikal

RALM VLM

211

21 Aug 2024

Great Memory, Shallow Reasoning: Limits of

k

NN-LMsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

235

21 Aug 2024

Large Language Model Driven Recommendation

...

321

20 Aug 2024

Training Language Models on the Knowledge Graph: Insights on Hallucinations and Their Detectability

Jiri Hron

Laura J. Culp

Gamaleldin F. Elsayed

...

161

14 Aug 2024

WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs

305

14 Aug 2024

Optimizing RAG Techniques for Automotive Industry PDF Chatbots: A Case Study with Locally Deployed Ollama Models

Fei Liu

Zejun Kang

Xing Han

150

12 Aug 2024

Retrieval-augmented code completion for local projects using large language modelsExpert systems with applications (ESWA), 2024

Marko Hostnik

Marko Robnik-Sikonja

RALM

266

09 Aug 2024

EfficientRAG: Efficient Retriever for Multi-Hop Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

237

08 Aug 2024

MaxMind: A Memory Loop Network to Enhance Software Productivity based on Large Language Models

232

07 Aug 2024

RAG Foundry: A Framework for Enhancing LLMs for Retrieval Augmented Generation

293

05 Aug 2024

QUITO: Accelerating Long-Context Reasoning through Query-Guided Context CompressionChina Conference on Information Retrieval (CIR), 2024

249

01 Aug 2024

Towards Achieving Human Parity on End-to-end Simultaneous Speech Translation via LLM Agent

296

31 Jul 2024

MLLM Is a Strong Reranker: Advancing Multimodal Retrieval-augmented Generation via Knowledge-enhanced Reranking and Noise-injected Training

Rivik Setty

Chengjin Xu

Vinay Setty

Jian Guo

272

31 Jul 2024

OptiMUS-0.3: Using Large Language Models to Model and Solve Optimization Problems at Scale

413

29 Jul 2024

MindSearch: Mimicking Human Minds Elicits Deep AI SearcherInternational Conference on Learning Representations (ICLR), 2024

384

29 Jul 2024

Understanding Memorisation in LLMs: Dynamics, Influencing Factors, and Implications

255

27 Jul 2024

Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks

334

26 Jul 2024

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

250

23 Jul 2024

MoRSE: Bridging the Gap in Cybersecurity Expertise with Retrieval Augmented Generation

303

22 Jul 2024

An Empirical Study of Retrieval Augmented Generation with Chain-of-Thought

Zhijian Ou

195

22 Jul 2024

Exploiting Pre-trained Models for Drug Target Affinity Prediction with Nearest Neighbors

Rui Yan

186

21 Jul 2024

Fact-Aware Multimodal Retrieval Augmentation for Accurate Medical Radiology Report Generation

412

21 Jul 2024

ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities

477

19 Jul 2024

Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark

285

18 Jul 2024

Retrieval-Augmented Generation for Natural Language Processing: A Survey

Shangyu Wu

Yufei Cui

...

Xue Liu

455

18 Jul 2024

Retrieval-Enhanced Machine Learning: Synthesis and Opportunities

367

17 Jul 2024

R+X: Retrieval and Execution from Everyday Human Videos

448

17 Jul 2024

Addressing Image Hallucination in Text-to-Image Generation through Factual Image Retrieval

Youngsun Lim

Hyunjung Shim

DiffM HILM MQ

186

15 Jul 2024

Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Efficiency in RAG Systems

Xing Zi

Qiang Wu

302

15 Jul 2024

ChatLogic: Integrating Logic Programming with Large Language Models for Multi-Step Reasoning

Zhongsheng Wang

Jiamou Liu

Qiming Bao

Hongfei Rong

Jingfeng Zhang

KELM LRM

235

14 Jul 2024

Mitigating Entity-Level Hallucination in Large Language Models

241

12 Jul 2024