v1v2v3 (latest)

Improving language models by retrieving from trillions of tokens

8 December 2021

George van den Driessche

Jean-Baptiste Lespiau

Saffron Huang

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "Improving language models by retrieving from trillions of tokens"

50 / 893 papers shown

CiteME: Can Language Models Accurately Cite Scientific Claims?

Ori Press

Andreas Hochlehnert

Christian Schroeder de Witt

Vishaal Udandarao

Ofir Press

Matthias Bethge

292

10 Jul 2024

Scaling Retrieval-Based Language Models with a Trillion-Token Datastore

Sewon Min

326

09 Jul 2024

Mixture of A Million Experts

Xu Owen He

MoE

375

04 Jul 2024

DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation

379

04 Jul 2024

The Structure of Financial Equity Research Reports -- Identification of the Most Frequently Asked Questions in Financial Analyst Reports to Automate Equity Research Using Llama 3 and GPT-4

Adria Pop

Jan Spörer

128

04 Jul 2024

Neurocache: Efficient Vector Retrieval for Long-range Language Modeling

Ali Safaya

Deniz Yuret

207

02 Jul 2024

RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs

Yue Yu

Zihan Liu

Chao Zhang

369

164

02 Jul 2024

$$\text{Memory}^3$: Language Modeling with Explicit Memory$

\text{Memory}^3

: Language Modeling with Explicit Memory

Zhiyu Li

...

Weinan E

235

01 Jul 2024

SecGenAI: Enhancing Security of Cloud-based Generative AI Applications within Australian Critical Technologies of National Interest

Christoforus Yoga Haryanto

215

01 Jul 2024

BeamAggR: Beam Aggregation Reasoning over Multi-source Knowledge for Multi-hop Question Answering

Haotian Wang

Bing Qin

252

28 Jun 2024

RAVEN: Multitask Retrieval Augmented Vision-Language Learning

282

27 Jun 2024

Banishing LLM Hallucinations Requires Rethinking Generalization

...

307

25 Jun 2024

Entropy-Based Decoding for Retrieval-Augmented Large Language Models

409

25 Jun 2024

Ragnarök: A Reusable RAG Framework and Baselines for TREC 2024 Retrieval-Augmented Generation Track

Ronak Pradeep

Nandan Thakur

Sahel Sharifymoghaddam

Eric Zhang

Ryan Nguyen

Daniel Campos

Nick Craswell

Jimmy Lin

289

24 Jun 2024

Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization

Cheng-Yu Hsieh

Yung-Sung Chuang

Chun-Liang Li

Zifeng Wang

Long T. Le

...

350

23 Jun 2024

LongRAG: Enhancing Retrieval-Augmented Generation with Long-context LLMs

Ziyan Jiang

Xueguang Ma

Wenhu Chen

RALM

395

103

21 Jun 2024

Data-Centric AI in the Age of Large Language Models

...

Bryan Kian Hsiang Low

ALM

360

20 Jun 2024

Augmenting Query and Passage for Retrieval-Augmented Generation using LLMs for Open-Domain Question Answering

Minsang Kim

Cheoneum Park

Seungjun Baek

RALM

170

20 Jun 2024

FoRAG: Factuality-optimized Retrieval Augmented Generation for Web-enhanced Long-form Question Answering

Yunqi Xu

Yinger Zhang

Jinjie Gu

290

19 Jun 2024

Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Di Wu

Jia-Chen Gu

Fan Yin

Nanyun Peng

Kai-Wei Chang

HILM

153

19 Jun 2024

Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

275

19 Jun 2024

In-Context Former: Lightning-fast Compressing Context for Large Language ModelConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Xiangfeng Wang

Enhong Chen

202

19 Jun 2024

In-Context In-Context Learning with Transformer Neural ProcessesSymposium on Advances in Approximate Bayesian Inference (AABI), 2024

Matthew Ashman

Cristiana-Diana Diaconu

Adrian Weller

Richard E. Turner

230

19 Jun 2024

InstructRAG: Instructing Retrieval-Augmented Generation via Self-Synthesized RationalesInternational Conference on Learning Representations (ICLR), 2024

604

19 Jun 2024

RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented GenerationInternational Conference on Computational Linguistics (COLING), 2024

Shuting Wang

Xin Yu

Mang Wang

Weipeng Chen

Yutao Zhu

Zhicheng Dou

RALM

222

18 Jun 2024

PlanRAG: A Plan-then-Retrieval Augmented Generation for Generative Large Language Models as Decision Makers

200

18 Jun 2024

What Kinds of Tokens Benefit from Distant Text? An Analysis on Long Context Language Modeling

137

17 Jun 2024

Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy

273

17 Jun 2024

SampleAttention: Near-Lossless Acceleration of Long Context LLM Inference with Adaptive Structured Sparse Attention

337

17 Jun 2024

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-HaystackNeural Information Processing Systems (NeurIPS), 2024

Artyom Sorokin

RALM ALM LRM ReLM ELM

275

142

14 Jun 2024

Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos

Zihui Xue

254

13 Jun 2024

Supportiveness-based Knowledge Rewriting for Retrieval-augmented Language Modeling

Yong Jiang

Fei Huang

Shikun Zhang

KELM

176

12 Jun 2024

Survey for Landing Generative AI in Social and E-commerce Recsys -- the Industry Perspectives

Da Xu

150

10 Jun 2024

Should We Fine-Tune or RAG? Evaluating Different Techniques to Adapt LLMs for Dialogue

511

10 Jun 2024

Retrieval & Fine-Tuning for In-Context Tabular ModelsNeural Information Processing Systems (NeurIPS), 2024

249

07 Jun 2024

VISTA: Visualized Text Embedding For Universal Multi-Modal RetrievalAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Yueze Wang

Zheng Liu

Shitao Xiao

Bo Zhao

Yongping Xiong

269

06 Jun 2024

Buffer of Thoughts: Thought-Augmented Reasoning with Large Language ModelsNeural Information Processing Systems (NeurIPS), 2024

Ling Yang

Joseph E. Gonzalez

Bin Cui

LLMAG LM&Ro LRM KELM

333

06 Jun 2024

XL-HeadTags: Leveraging Multimodal Retrieval Augmentation for the Multilingual Generation of News Headlines and Tags

Faisal Tareque Shohan

223

06 Jun 2024

Measuring Retrieval Complexity in Question Answering Systems

Matteo Gabburo

Nicolaas Paul Jedema

Siddhant Garg

Leonardo F. R. Ribeiro

Alessandro Moschitti

181

05 Jun 2024

The Scandinavian Embedding Benchmarks: Comprehensive Assessment of Multilingual and Monolingual Text Embedding

253

04 Jun 2024

ACCORD: Closing the Commonsense Measurability Gap

François Roewer-Després

375

04 Jun 2024

EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs

308

03 Jun 2024

Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning

Cheng Tan

Jingxuan Wei

Linzhuang Sun

Zhangyang Gao

Siyuan Li

Bihui Yu

Ruifeng Guo

Stan Z. Li

ReLM LRM 3DV

282

31 May 2024

One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models

265

30 May 2024

Toward Conversational Agents with Context and Time Sensitive Long-term Memory

416

29 May 2024

Evaluating the External and Parametric Knowledge Fusion of Large Language Models

...

Lifeng Shang

Qun Liu

Yong Liu

Ruiming Tang

KELM

246

29 May 2024

CtrlA: Adaptive Retrieval-Augmented Generation via Probe-Guided Control

270

29 May 2024

Nearest Neighbor Speculative Decoding for LLM Generation and Attribution

730

29 May 2024

Automatically Generating Numerous Context-Driven SFT Data for LLMs across Diverse Granularity

Shanghaoran Quan

244

26 May 2024

Accelerating Inference of Retrieval-Augmented Generation via Sparse Context Selection

...

247

25 May 2024