v1v2 (latest)

TriviaQA: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension

9 May 2017

Luke Zettlemoyer

Papers citing "TriviaQA: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension"

50 / 2,197 papers shown

Title
Enhancing Uncertainty Estimation in LLMs with Expectation of Aggregated Internal Belief Zeguan Xiao Diyang Dou Boya Xiong Yun-Nung Chen Guanhua Chen 73 0 0 24 Dec 2025
DrVoice: Parallel Speech-Text Voice Conversation Model via Dual-Resolution Speech Representations Chao-Hong Tan Qian Chen Wen Wang Chong Deng Qinglin Zhang ... Yafeng Chen Hui Wang Jiaqing Liu Jieping Ye Jieping Ye AuLLM 244 0 0 24 Dec 2025
Towards Unification of Hallucination Detection and Fact Verification for Large Language Models Weihang Su Jianming Long Changyue Wang Shiyu Lin Jingyan Xu Ziyi Ye Qingyao Ai Yiqun Liu HILM 72 0 0 02 Dec 2025
Latent Debate: A Surrogate Framework for Interpreting LLM Thinking Lihu Chen Xiang Yin Francesca Toni LRM 112 0 0 01 Dec 2025
Agentic Policy Optimization via Instruction-Policy Co-Evolution Han Zhou Xingchen Wan Ivan Vulić Anna Korhonen 68 0 0 01 Dec 2025
LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems Zhiyuan Wang Aniri Tianlong Chen Yue Zhang Heng Tao Shen Xiaoshuang Shi Kaidi Xu 69 0 0 01 Dec 2025
Ensemble Privacy Defense for Knowledge-Intensive LLMs against Membership Inference Attacks Haowei Fu Bo Ni Han Xu Kunpeng Liu Dan Lin Tyler Derr 0 0 0 01 Dec 2025
A Rosetta Stone for AI Benchmarks A. Ho Jean-Stanislas Denain David Atanasov Samuel Albanie Rohin Shah ELM 216 0 0 28 Nov 2025
BengaliFig: A Low-Resource Challenge for Figurative and Culturally Grounded Reasoning in Bengali Abdullah Al Sefat 140 1 0 25 Nov 2025
Reducing Latency of LLM Search Agent via Speculation-based Algorithm-System Co-Design Zixiao Huang Wen Zeng Tianyu Fu Tengxuan Liu Yizhou Sun ... Y. Li Quanlu Zhang Guohao Dai Zhenhua Zhu Yu Wang LRM 122 0 0 25 Nov 2025
CafeQ: Calibration-free Quantization via Learned Transformations and Adaptive Rounding Ziteng Sun Adrian Benton Samuel Kushnir Asher Trockman Vikas Singh Suhas Diggavi A. Suresh MQ 138 0 0 24 Nov 2025
Toward an AI-Native Internet: Rethinking the Web Architecture for Semantic Retrieval Muhammad Bilal Zafar Qazi Marco Canini 56 0 0 23 Nov 2025
Hallucinate Less by Thinking More: Aspect-Based Causal Abstention for Large Language Models Vy Nguyen Ziqi Xu J. Chan Estrid He Feng Xia Xiuzhen Zhang 108 0 0 21 Nov 2025
MUCH: A Multilingual Claim Hallucination Benchmark Jérémie Dentan Alexi Canesse Davide Buscaldi A. Shabou Sonia Vanier HILM 174 0 0 21 Nov 2025
Learning to Compress: Unlocking the Potential of Large Language Models for Text Representation Y. Zhang Yizheng Zhao Chen-Hao Hu Binxing Jiao Daxin Jiang Ruihang Miao Cam-Tu Nguyen 145 0 0 21 Nov 2025
MuISQA: Multi-Intent Retrieval-Augmented Generation for Scientific Question Answering Zhiyuan Li Haisheng Yu Guangchuan Guo Nan Zhou Jiajun Zhang RALM 255 0 0 20 Nov 2025
A Multifaceted Analysis of Negative Bias in Large Language Models through the Lens of Parametric KnowledgeIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2025 Jongyoon Song Sangwon Yu Sungroh Yoon 36 0 0 14 Nov 2025
Chain of Summaries: Summarization Through Iterative Questioning William Brach Lukas Galke Poech HILM 200 0 0 12 Nov 2025
TARG: Training-Free Adaptive Retrieval Gating for Efficient RAG Yufeng Wang Lu wei Haibin Ling 96 0 0 12 Nov 2025
SpeechJudge: Towards Human-Level Judgment for Speech Naturalness Xueyao Zhang C. Wang Huan Liao Z. Li Yuancheng Wang ... Dongya Jia Yuanzhe Chen X. Li Z. Chen Z. Wu EGVM AuLLM 417 0 0 11 Nov 2025
From Experience to Strategy: Empowering LLM Agents with Trainable Graph MemoryAnnual Meeting of the Association for Computational Linguistics (ACL), 2025 Siyu Xia Zekun Xu Jiajun Chai Wentian Fan Yan Song Xiaohan Wang G. Yin Wei Lin Haifeng Zhang Jun Wang LLMAG 429 0 0 11 Nov 2025
2D Representation for Unguided Single-View 3D Super-Resolution in Real-Time Ignasi Mas Ivan Huerta Ramon Morros Javier Ruiz-Hidalgo 3DV 136 0 0 11 Nov 2025
Beyond Superficial Forgetting: Thorough Unlearning through Knowledge Density Estimation and Block Re-insertion Feng Guo Yuntao Wen Shen Gao Junshuo Zhang Shuo Shang KELM MU 394 0 0 11 Nov 2025
Testing and Evaluation of Underwater Vehicle Using Hardware-In-The-Loop Simulation with HoloOcean Braden Meyers Joshua G. Mangelson 72 1 0 10 Nov 2025
Revisiting NLI: Towards Cost-Effective and Human-Aligned Metrics for Evaluating LLMs in Question Answering Sai Shridhar Balamurali Lu Cheng 100 0 0 10 Nov 2025
Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks Yauhen Babakhin Radek Osmulski Ronay Ak Gabriel de Souza P. Moreira Mengyao Xu Benedikt Schifferer Bo Liu Even Oldridge 123 2 0 10 Nov 2025
MobileLLM-Pro Technical Report Patrick Huber Ernie Chang Wei Wen Igor Fedorov Tarek Elgamal ... Vikas Chandra Ahmed Aly Anuj Kumar Raghuraman Krishnamoorthi Adithya Sagar 100 0 0 10 Nov 2025
Learning to Focus: Focal Attention for Selective and Scalable Transformers Dhananjay Ram Wei Xia Stefano Soatto 280 0 0 10 Nov 2025
LoRA on the Go: Instance-level Dynamic LoRA Selection and Merging Seungeon Lee Soumi Das Manish Gupta Krishna P. Gummadi MoMe 564 1 0 10 Nov 2025
Injecting Falsehoods: Adversarial Man-in-the-Middle Attacks Undermining Factual Recall in LLMs Alina Fastowski Bardh Prenkaj Yuxiao Li Gjergji Kasneci AAML KELM HILM 263 0 0 08 Nov 2025
Motif 2 12.7B technical report Junghwan Lim S. W. Lee Dongseok Kim Taehyun Kim Eunhwan Park ... Kungyu Lee Dongpin Oh Yeongjae Park Bokki Ryu Dongjoo Weon 92 0 0 07 Nov 2025
Attention and Compression is all you need for Controllably Efficient Language Models Jatin Prakash N. Jethani Rajesh Ranganath MQ VLM 442 0 0 07 Nov 2025
Steering Language Models with Weight Arithmetic Constanza Fierro Fabien Roger MoMe LLMSV 461 0 0 07 Nov 2025
The Illusion of Certainty: Uncertainty quantification for LLMs fails under ambiguity Tim Tomov Dominik Fuchsgruber Tom Wollschlager Stephan Günnemann 128 0 0 06 Nov 2025
DMA: Online RAG Alignment with Human Feedback Yu Bai Yukai Miao Dawei Wang Li Chen Fei Long ... Yanyu Ren Tianfeng Liu Hongtao Xie Ce Yang Xuhui Cai 146 0 0 06 Nov 2025
ChiMDQA: Towards Comprehensive Chinese Document QA with Fine-grained EvaluationInternational Conference on Artificial Neural Networks (ICANN), 2025 Jing Gao Shutiao Luo Yumeng Liu Yuanming Li Hongji Zeng 88 0 0 05 Nov 2025
MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning Qianhao Yuan Jie Lou Zichao Li Jiawei Chen Yaojie Lu Hongyu Lin Le Sun Debing Zhang Xianpei Han OffRL RALM 175 0 0 04 Nov 2025
LiveSearchBench: An Automatically Constructed Benchmark for Retrieval and Reasoning over Dynamic Knowledge Heng Zhou Ao Yu Yuchen Fan Jianing Shi Li Kang ... Y. Wu Tiancheng He Yiran Qin Wenlong Zhang Zhenfei Yin KELM RALM 423 0 0 03 Nov 2025
Prompt-R1: Collaborative Automatic Prompting Framework via End-to-end Reinforcement Learning Wenjin Liu Haoran Luo X. Lin Haoming Liu Tiesunlong Shen Jiapu Wang Rui Mao Erik Cambria LLMAG OffRL LRM 304 1 0 02 Nov 2025
Optimizing Native Sparse Attention with Latent Attention and Local Global Alternating Strategies Yuxuan Hu Jianchao Tan Jiaqi Zhang Wen Zan Pingwei Sun Yifan Lu Yerui Sun Yuchen Xie Xunliang Cai Jing Zhang 228 0 0 02 Nov 2025
Efficient Test-Time Retrieval Augmented Generation Hailong Yin B. Zhu Yue Yu Chong-Wah Ngo RALM 3DV 185 0 0 02 Nov 2025
Zero-RAG: Towards Retrieval-Augmented Generation with Zero Redundant Knowledge Qi Luo X. Li Junqi Dai Shuang Cheng Xipeng Qiu RALM 329 1 0 01 Nov 2025
Separate the Wheat from the Chaff: Winnowing Down Divergent Views in Retrieval Augmented Generation Song Wang Zihan Chen Peng Wang Zhepei Wei Zhen Tan Yu Meng Cong Shen Jundong Li 161 1 0 01 Nov 2025
Certain but not Probable? Differentiating Certainty from Probability in LLM Token Outputs for Probabilistic Scenarios Autumn Toney-Wails Ryan Wails 64 0 0 01 Nov 2025
A CPU-Centric Perspective on Agentic AI Ritik Raj Hong Wang Tushar Krishna 201 0 0 01 Nov 2025
RzenEmbed: Towards Comprehensive Multimodal Retrieval Weijian Jian Yajun Zhang Dawei Liang Chunyu Xie Yixiao He Dawei Leng Yuhui Yin 109 0 0 31 Oct 2025
MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval Qi Luo X. Li Yuxin Wang Tingshuo Fan Yuan Li Xinchi Chen Xipeng Qiu RALM KELM LRM 158 0 0 31 Oct 2025
Encoder-Decoder or Decoder-Only? Revisiting Encoder-Decoder Large Language Model Biao Zhang Yong Cheng Siamak Shakeri Xinyi Wang Min Ma Orhan Firat 129 1 0 30 Oct 2025
Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning Qi Luo Xiaonan Li Tingshuo Fan Xinchi Chen Xipeng Qiu RALM 3DV LRM 517 0 0 30 Oct 2025
MossNet: Mixture of State-Space Experts is a Multi-Head Attention Shikhar Tuli James Smith Haris Jeelani Chi-Heng Lin Abhishek Patel Vasili Ramanishka Yen-Chang Hsu Hongxia Jin MoE 259 0 0 30 Oct 2025