The Power of Noise: Redefining Retrieval for RAG SystemsAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2024

Florin Cuconasu

Giovanni Trappolini

F. Siciliano

Simone Filice

613

305

26 Jan 2024

Accelerating Retrieval-Augmented Language Model Serving with Speculation

260

25 Jan 2024

Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4

151

24 Jan 2024

JustiLM: Few-shot Justification Generation for Explainable Fact-Checking of Real-world ClaimsTransactions of the Association for Computational Linguistics (TACL), 2024

Fengzhu Zeng

Wei Gao

319

16 Jan 2024

Attendre: Wait To Attend By Retrieval With Evicted Queries in Memory-Based Transformers for Long Context Processing

Zi Yang

Nan Hua

RALM

225

10 Jan 2024

CaMML: Context-Aware Multimodal Learner for Large Models

276

06 Jan 2024

Large Language Models for Social Networks: Applications, Challenges, and Solutions

207

04 Jan 2024

ReFusion: Improving Natural Language Understanding with Computation-Efficient Retrieval Representation FusionInternational Conference on Learning Representations (ICLR), 2024

Shangyu Wu

Ying Xiong

Yufei Cui

Xue Liu

Buzhou Tang

Tei-Wei Kuo

Chun Jason Xue

206

04 Jan 2024

Navigating Uncertainty: Optimizing API Dependency for Hallucination Reduction in Closed-Book Question Answering

124

03 Jan 2024

If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents

...

473

114

01 Jan 2024

Retrieval-Augmented Egocentric Video CaptioningComputer Vision and Pattern Recognition (CVPR), 2024

Jilan Xu

Yifei Huang

Junlin Hou

Rui Feng

409

01 Jan 2024

Structured Packing in LLM Training Improves Long Context Utilization

Henryk Michalewski

371

28 Dec 2023

Adapting Large Language Models for Education: Foundational Capabilities, Potentials, and Challenges

Qingyao Li

Weinan Zhang

Ruiming Tang

Yong Yu

AI4Ed ELM

359

27 Dec 2023

LeanVec: Searching vectors faster by making them fit

257

26 Dec 2023

Supervised Knowledge Makes Large Language Models Better In-context Learners

...

Xing Xie

389

26 Dec 2023

Align on the Fly: Adapting Chatbot Behavior to Established Norms

Chunpu Xu

Ge Zhang

Ruibo Liu

181

26 Dec 2023

Towards Consistent Language Models Using Declarative Constraints

Jasmin Mousavi

Arash Termehchy

HILM ALM

203

24 Dec 2023

Towards Efficient Generative Large Language Model Serving: A Survey from Algorithms to Systems

419

121

23 Dec 2023

RealGen: Retrieval Augmented Generation for Controllable Traffic Scenarios

Wenhao Ding

Yulong Cao

Ding Zhao

Chaowei Xiao

Marco Pavone

172

19 Dec 2023

Jack of All Tasks, Master of Many: Designing General-purpose Coarse-to-Fine Vision-Language Model

Ser-Nam Lim

386

19 Dec 2023

Retrieval-Augmented Generation for Large Language Models: A Survey

1.2K

2,702

18 Dec 2023

kNN-ICL: Compositional Task-Oriented Parsing Generalization with Nearest Neighbor In-Context Learning

Philip S. Yu

200

17 Dec 2023

AI capabilities can be significantly improved without expensive retraining

Tom Davidson

Jean-Stanislas Denain

Pablo Villalobos

Guillem Bas

OffRL VLM

236

12 Dec 2023

PaperQA: Retrieval-Augmented Generative Agent for Scientific Research

Jakub Lála

Odhran O'Donoghue

Aleksandar Shtedritski

433

147

08 Dec 2023

SparQ Attention: Bandwidth-Efficient LLM InferenceInternational Conference on Machine Learning (ICML), 2023

Carlo Luschi

437

08 Dec 2023

LLM as OS, Agents as Apps: Envisioning AIOS, Agents and the AIOS-Agent Ecosystem

Juntao Tan

248

06 Dec 2023

Scaling Laws for Adversarial Attacks on Language Model Activations

Stanislav Fort

140

05 Dec 2023

PEFA: Parameter-Free Adapters for Large-scale Embedding-based Retrieval ModelsWeb Search and Data Mining (WSDM), 2023

262

05 Dec 2023

A Glitch in the Matrix? Locating and Detecting Language Model Grounding with FakepediaAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

494

04 Dec 2023

UniIR: Training and Benchmarking Universal Multimodal Information Retrievers

Ge Zhang

267

126

28 Nov 2023

Rethinking Privacy in Machine Learning Pipelines from an Information Flow Control Perspective

Santiago Zanella Béguelin

Menglin Xia

Victor Rühle

205

27 Nov 2023

Transforming organic chemistry research paradigms: moving from manual efforts to the intersection of automation and artificial intelligenceNational Science Open (NSO), 2023

Chengchun Liu

Yuntian Chen

Fanyang Mo

154

26 Nov 2023

Walking a Tightrope -- Evaluating Large Language Models in High-Risk Domains

Carolin (Haas) Lawrence

AILaw ALM ELM

273

25 Nov 2023

Calibrated Language Models Must HallucinateSymposium on the Theory of Computing (STOC), 2023

Adam Tauman Kalai

Santosh Vempala

HILM

415

132

24 Nov 2023

Probabilistic Tree-of-thought Reasoning for Answering Knowledge-intensive Complex QuestionsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Jiajie Zhang

Juanzi Li

Lei Hou

LRM

167

23 Nov 2023

Minimizing Factual Inconsistency and Hallucination in Large Language Models

Saisubramaniam Gopalakrishnan

HILM

156

23 Nov 2023

Retrieval-Augmented Layout Transformer for Content-Aware Layout GenerationComputer Vision and Pattern Recognition (CVPR), 2023

440

22 Nov 2023

Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey

...

367

21 Nov 2023

TPTU-v2: Boosting Task Planning and Tool Usage of Large Language Model-based Agents in Real-world Systems

...

292

19 Nov 2023

Augmenting Unsupervised Reinforcement Learning with Self-Reference

Rui Lu

Gao Huang

216

16 Nov 2023

Chain-of-Note: Enhancing Robustness in Retrieval-Augmented Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Kaixin Ma

Dong Yu

264

166

15 Nov 2023

How Well Do Large Language Models Truly Ground?North American Chapter of the Association for Computational Linguistics (NAACL), 2023

Hyunji Lee

257

15 Nov 2023