Title
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design Yanbiao Liang Huihong Shi Haikuo Shao Zhongfeng Wang 13 0 0 07 Apr 2025
Enhancing Compositional Reasoning in Vision-Language Models with Synthetic Preference Data Samarth Mishra Kate Saenko Venkatesh Saligrama CoGe LRM 32 0 0 07 Apr 2025
REEF: Relevance-Aware and Efficient LLM Adapter for Video Understanding Sakib Reza Xiyun Song Heather Yu Zongfang Lin Mohsen Moghaddam Octavia Camps 23 0 0 07 Apr 2025
Revealing the Intrinsic Ethical Vulnerability of Aligned Large Language Models Jiawei Lian Jianhong Pan L. Wang Yi Wang Shaohui Mei Lap-Pui Chau AAML 24 0 0 07 Apr 2025
Saliency-driven Dynamic Token Pruning for Large Language Models Yao Tao Yehui Tang Yun Wang Mingjian Zhu Hailin Hu Yunhe Wang 32 0 0 06 Apr 2025
Hessian of Perplexity for Large Language Models by PyTorch autograd (Open Source) Ivan Ilin 16 0 0 06 Apr 2025
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding Yang Jiao Haibo Qiu Zequn Jie S. Chen Jingjing Chen Lin Ma Yu Jiang 26 2 0 06 Apr 2025
Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation Mohammad Amaan Sayeed Engin Tekin Maryam Nadeem Nancy A. ElNaker A. Singh Natalia Vassilieva Boulbaba Ben Amor 21 0 0 06 Apr 2025
Thanos: A Block-wise Pruning Algorithm for Efficient Large Language Model Compression Ivan Ilin Peter Richtárik 19 0 0 06 Apr 2025
A Benchmark for End-to-End Zero-Shot Biomedical Relation Extraction with LLMs: Experiments with OpenAI Models Aviv Brokman Xuguang Ai Yuhang Jiang Shashank Gupta Ramakanth Kavuluru SyDa LM&MA 24 0 0 05 Apr 2025
Towards Understanding and Improving Refusal in Compressed Models via Mechanistic Interpretability Vishnu Kabir Chhabra Mohammad Mahdi Khalili AI4CE 25 0 0 05 Apr 2025
Window Token Concatenation for Efficient Visual Large Language Models Yifan Li Wentao Bao Botao Ye Zhen Tan Tianlong Chen Huan Liu Yu Kong VLM 39 0 0 05 Apr 2025
GROVE: A Generalized Reward for Learning Open-Vocabulary Physical Skill Jieming Cui Tengyu Liu Ziyu Meng Jiale Yu Ran Song Wei Zhang Yixin Zhu Siyuan Huang VLM 40 1 0 05 Apr 2025
Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models Mingyang Wang Heike Adel Lukas Lange Yihong Liu Ercong Nie Jannik Strötgen Hinrich Schütze HILM 56 0 0 05 Apr 2025
Rethinking Multilingual Continual Pretraining: Data Mixing for Adapting LLMs Across Languages and Resources Zihao Li Shaoxiong Ji Hengyu Luo Jörg Tiedemann CLL 38 0 0 05 Apr 2025
ProbRes: Probabilistic Jump Diffusion for Open-World Egocentric Activity Recognition Sanjoy Kundu Shanmukha Vellamchetti Sathyanarayanan N. Aakur EgoV 50 0 0 04 Apr 2025
Beyond Progress Measures: Theoretical Insights into the Mechanism of Grokking Zihan Gu Ruoyu Chen Hua Zhang Yue Hu Xiaochun Cao 27 0 0 04 Apr 2025
Can AI Master Construction Management (CM)? Benchmarking State-of-the-Art Large Language Models on CM Certification Exams Ruoxin Xiong Yanyu Wang Suat Gunhan Yimin Zhu Charles Berryman ELM 26 0 0 04 Apr 2025
Think When You Need: Self-Adaptive Chain-of-Thought Learning Junjie Yang Ke Lin Xing Yu ReLM LRM AI4CE 35 1 0 04 Apr 2025
Joint Retrieval of Cloud properties using Attention-based Deep Learning Models Zahid Hassan Tushar Adeleke Ademakinwa Jianwu Wang Zhibo Zhang Sanjay Purushotham 3DPC 34 0 0 04 Apr 2025
How Social is It? A Benchmark for LLMs' Capabilities in Multi-user Multi-turn Social Agent Tasks Yusen Wu Junwu Xiong Xiaotie Deng LLMAG 36 0 0 04 Apr 2025
Using Attention Sinks to Identify and Evaluate Dormant Heads in Pretrained LLMs Pedro Sandoval-Segura Xijun Wang Ashwinee Panda Micah Goldblum Ronen Basri Tom Goldstein David Jacobs 17 0 0 04 Apr 2025
Optimizing Quantum Circuits via ZX Diagrams using Reinforcement Learning and Graph Neural Networks Alexander Mattick Maniraman Periyasamy Christian Ufrecht Abhishek Y. Dubey Christopher Mutschler Axel Plinge Daniel D. Scherer 36 0 0 04 Apr 2025
Accelerating Particle-based Energetic Variational Inference Xuelian Bao Lulu Kang Chun Liu Yiwei Wang BDL 54 0 0 04 Apr 2025
Language Models Are Implicitly Continuous Samuele Marro Davide Evangelista X. A. Huang Emanuele La Malfa M. Lombardi Michael Wooldridge 26 0 0 04 Apr 2025
The H-Elena Trojan Virus to Infect Model Weights: A Wake-Up Call on the Security Risks of Malicious Fine-Tuning Virilo Tejedor Cristina Zuheros Carlos Peláez-González David Herrera-Poyatos Andrés Herrera-Poyatos F. Herrera 24 0 0 04 Apr 2025
Beyond Accuracy: The Role of Calibration in Self-Improving Large Language Models Liangjie Huang Dawei Li Huan Liu Lu Cheng LRM 34 0 0 03 Apr 2025
Language Models Guidance with Multi-Aspect-Cueing: A Case Study for Competitor Analysis Amir Hadifar Christopher Ochs Arjan Van Ewijk ELM 43 0 0 03 Apr 2025
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models Mateusz Pach Shyamgopal Karthik Quentin Bouniot Serge Belongie Zeynep Akata VLM 54 0 0 03 Apr 2025
DaKultur: Evaluating the Cultural Awareness of Language Models for Danish with Native Speakers Max Müller-Eberstein Mike Zhang Elisa Bassignana Peter Brunsgaard Trolle Rob van der Goot ELM 34 0 0 03 Apr 2025
LLM Library Learning Fails: A LEGO-Prover Case Study Ian Berlot-Attwell Frank Rudzicz Xujie Si ELM 34 0 0 03 Apr 2025
How Post-Training Reshapes LLMs: A Mechanistic View on Knowledge, Truthfulness, Refusal, and Confidence Hongzhe Du Weikai Li Min Cai Karim Saraipour Zimin Zhang Himabindu Lakkaraju Yizhou Sun Shichang Zhang KELM 51 0 0 03 Apr 2025
VARGPT-v1.1: Improve Visual Autoregressive Large Unified Model via Iterative Instruction Tuning and Reinforcement Learning Xianwei Zhuang Yuxin Xie Yufan Deng Dongchao Yang Liming Liang Jinghan Ru Yuguo Yin Yuexian Zou 61 1 0 03 Apr 2025
Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training Zhijun Wang Jiahuan Li Hao Zhou Rongxiang Weng J. Wang Xin Huang Xue Han Junlan Feng Chao Deng Shujian Huang LRM 39 1 0 02 Apr 2025
Graphically Speaking: Unmasking Abuse in Social Media with Conversation Insights Célia Nouri Jean-Philippe Cointet Chloé Clavel 37 0 0 02 Apr 2025
LightDefense: A Lightweight Uncertainty-Driven Defense against Jailbreaks via Shifted Token Distribution Zhuoran Yang Jie Peng Zhen Tan Tianlong Chen Yanyong Zhang AAML 44 0 0 02 Apr 2025
Efficient Federated Learning Tiny Language Models for Mobile Network Feature Prediction Daniel Becking Ingo Friese Karsten Müller Thomas Buchholz Mandy Galkow-Schneider Wojciech Samek D. Marpe 36 0 0 02 Apr 2025
Rethinking industrial artificial intelligence: a unified foundation framework Jay Lee Hanqi Su AI4CE 39 1 0 02 Apr 2025
Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish Cedric Lothritz Jordi Cabot 28 0 0 02 Apr 2025
Beyond Non-Expert Demonstrations: Outcome-Driven Action Constraint for Offline Reinforcement Learning Ke Jiang Wen Jiang Y. Li Xiaoyang Tan OffRL 35 0 0 02 Apr 2025
Leveraging Modality Tags for Enhanced Cross-Modal Video Retrieval A. Fragomeni Dima Damen Michael Wray 33 0 0 02 Apr 2025
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations Chongjie Si Zhiyi Shi Xuehui Wang Yichen Xiao Xiaokang Yang Wei-Ming Shen AI4CE 58 0 0 01 Apr 2025
The Illusionist's Prompt: Exposing the Factual Vulnerabilities of Large Language Models with Linguistic Nuances Yining Wang Y. Wang Xi Li Mi Zhang Geng Hong Min Yang AAML HILM 60 0 0 01 Apr 2025
Making Large Language Models Better Reasoners with Orchestrated Streaming Experiences Xiangyang Liu Junliang He Xipeng Qiu ReLM LRM 62 0 0 01 Apr 2025
Zero-shot Benchmarking: A Framework for Flexible and Scalable Automatic Evaluation of Language Models José P. Pombal Nuno M. Guerreiro Ricardo Rei André F. T. Martins ALM 61 0 0 01 Apr 2025
Exposing the Ghost in the Transformer: Abnormal Detection for Large Language Models via Hidden State Forensics Shide Zhou K. Wang Ling Shi H. Wang 44 0 0 01 Apr 2025
Synthesized Annotation Guidelines are Knowledge-Lite Boosters for Clinical Information Extraction Enshuo Hsu Martin Ugbala Krishna Kumar Kookal Zouaidi Kawtar Nicholas L. Rider Muhammad F. Walji Kirk Roberts 24 0 0 01 Apr 2025
PRISM-0: A Predicate-Rich Scene Graph Generation Framework for Zero-Shot Open-Vocabulary Tasks Abdelrahman Elskhawy Mengze Li Nassir Navab Benjamin Busam VLM 46 0 0 01 Apr 2025
Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization Di Wu Jia-Chen Gu Kai-Wei Chang Nanyun Peng 34 0 0 01 Apr 2025
MetaLoRA: Tensor-Enhanced Adaptive Low-Rank Fine-tuning Maolin Wang Xiangyu Zhao AI4CE 39 0 0 01 Apr 2025