v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Journal of machine learning research (JMLR), 2019

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 12,040 papers shown

LAOF: Robust Latent Action Learning with Optical Flow Constraints

112

20 Nov 2025

NLP Datasets for Idiom and Figurative Language Tasks

125

20 Nov 2025

AskDB: An LLM Agent for Natural Language Interaction with Relational Databases

108

20 Nov 2025

When Structure Doesn't Help: LLMs Do Not Read Text-Attributed Graphs as Effectively as We Expected

Haotian Xu

Yuning You

Tengfei Ma

116

20 Nov 2025

You Only Forward Once: An Efficient Compositional Judging Paradigm

139

20 Nov 2025

Sparse Autoencoders are Topic Models

Leander Girrbach

Zeynep Akata

119

20 Nov 2025

Text2Loc++: Generalizing 3D Point Cloud Localization from Natural Language

156

19 Nov 2025

Walrus: A Cross-Domain Foundation Model for Continuum Dynamics

Michael McCabe

Payel Mukhopadhyay

Tanya Marwah

Bruno Régaldo-Saint Blancard

...

243

19 Nov 2025

Insert In Style: A Zero-Shot Generative Framework for Harmonious Cross-Domain Object Composition

268

19 Nov 2025

What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity

Alexis Audran-Reiss

Jordi Armengol-Estapé

...

175

19 Nov 2025

UniFit: Towards Universal Virtual Try-on with MLLM-Guided Semantic Alignment

19 Nov 2025

PocketLLM: Ultimate Compression of Large Language Models via Meta Networks

124

19 Nov 2025

IPR-1: Interactive Physical Reasoner

...

407

19 Nov 2025

UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space

216

19 Nov 2025

Entropy-Based Measurement of Value Drift and Alignment Work in Large Language Models

Samih Fadli

19 Nov 2025

Effective Code Membership Inference for Code Completion Models via Adversarial Prompts

264

19 Nov 2025

SplitFlux: Learning to Decouple Content and Style from a Single Image

223

19 Nov 2025

DEVAL: A Framework for Evaluating and Improving the Derivation Capability of Large Language Models

213

18 Nov 2025

Foundational Question Generation for Video Question Answering via an Embedding-Integrated Approach

Ju-Young Oh

106

18 Nov 2025

Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning

146

18 Nov 2025

ArbESC+: Arabic Enhanced Edit Selection System Combination for Grammatical Error Correction Resolving conflict and improving system combination in Arabic GEC

Ahlam Alrehili

Areej Alhothali

KELM

134

18 Nov 2025

Scalable and Efficient Large-Scale Log Analysis with LLMs: An IT Software Support Case Study

17 Nov 2025

Uni-Hema: Unified Model for Digital Hematopathology

153

17 Nov 2025

Translation Entropy: A Statistical Framework for Evaluating Translation Systems

Ronit D. Gross

Yanir Harel

Ido Kanter

17 Nov 2025

CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving

...

252

17 Nov 2025

Infinite-Story: A Training-Free Consistent Text-to-Image Generation

112

17 Nov 2025

NeuroLex: A Lightweight Domain Language Model for EEG Report Understanding and Generation

Kang Yin

Hye-Bin Shin

144

17 Nov 2025

CreBench: Human-Aligned Creativity Evaluation from Idea to Process to Product

...

123

17 Nov 2025

Tokenize Once, Recommend Anywhere: Unified Item Tokenization for Multi-domain LLM-based Recommendation

Yu Hou

Won-Yong Shin

17 Nov 2025

Multivariate Diffusion Transformer with Decoupled Attention for High-Fidelity Mask-Text Collaborative Facial Generation

230

16 Nov 2025

HiGFA: Hierarchical Guidance for Fine-grained Data Augmentation with Diffusion Models

705

16 Nov 2025

MAVIS: A Benchmark for Multimodal Source Attribution in Long-form Visual Question Answering

Seokwon Song

Minsu Park

Gunhee Kim

106

15 Nov 2025

GeoMVD: Geometry-Enhanced Multi-View Generation Model Based on Geometric Information Extraction

315

15 Nov 2025

OAD-Promoter: Enhancing Zero-shot VQA using Large Language Models with Object Attribute Description

263

15 Nov 2025

Do LLMs and Humans Find the Same Questions Difficult? A Case Study on Japanese Quiz Answering

105

15 Nov 2025

Mixture of States: Routing Token-Level Dynamics for Multimodal Generation

...

Juan-Manuel Perez-Rua

105

15 Nov 2025

Large Language Models and 3D Vision for Intelligent Robotic Perception and AutonomyItalian National Conference on Sensors (INS), 2025

Vinit Mehta

Charu Sharma

Karthick Thiyagarajan

LM&Ro

375

14 Nov 2025

Improving LLM's Attachment to External Knowledge In Dialogue Generation Tasks Through Entity Anonymization

Hadi Sheikhi

Chenyang Huang

Osmar R. Zaiane

113

14 Nov 2025

KVSwap: Disk-aware KV Cache Offloading for Long-Context On-device Inference

351

14 Nov 2025

Selective Sinkhorn Routing for Improved Sparse Mixture of Experts

457

12 Nov 2025

Not Everything That Counts Can Be Counted: A Case for Safe Qualitative AISoftwareX (SoftwareX), 2025

Stine Beltoft

Lukas Galke

12 Nov 2025

CleverBirds: A Multiple-Choice Benchmark for Fine-grained Human Knowledge Tracing

103

11 Nov 2025

A Unified Geometric Field Theory Framework for Transformers: From Manifold Embeddings to Kernel Modulation

Xianshuai Shi

Jianfeng Zhu

Leibo Liu

151

11 Nov 2025

Compression then Matching: An Efficient Pre-training Paradigm for Multimodal Embedding

254

11 Nov 2025

ProbSelect: Stochastic Client Selection for GPU-Accelerated Compute Devices in the 3D Continuum

Andrija Stanisic

Stefan Nastic

116

11 Nov 2025

Laytrol: Preserving Pretrained Knowledge in Layout Control for Multimodal Diffusion Transformers

294

11 Nov 2025

A Circular Argument : Does RoPE need to be Equivariant for Vision?

160

11 Nov 2025

WaterMod: Modular Token-Rank Partitioning for Probability-Balanced LLM Watermarking

256

11 Nov 2025

Majority Rules: LLM Ensemble is a Winning Approach for Content Categorization

Ariel Kamen

Yakov Kamen

11 Nov 2025

Introducing A Bangla Sentence - Gloss Pair Dataset for Bangla Sign Language Translation and Research

154

11 Nov 2025