v1v2v3v4 (latest)

Interpreting CLIP's Image Representation via Text-Based Decomposition

International Conference on Learning Representations (ICLR), 2023

9 October 2023

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "Interpreting CLIP's Image Representation via Text-Based Decomposition"

50 / 122 papers shown

Multimodal Language Models See Better When They Look Shallower

356

30 Apr 2025

Prisma: An Open Source Toolkit for Mechanistic Interpretability in Vision and Video

546

28 Apr 2025

Decoding Vision Transformers: the Diffusion Steering Lens

385

18 Apr 2025

Transformation of audio embeddings into interpretable, concept-based representations

Alice Zhang

Edison Thomaz

Lie Lu

221

18 Apr 2025

Understanding Attention Mechanism in Video Diffusion Models

342

16 Apr 2025

Steering CLIP's vision transformer with sparse autoencoders

286

11 Apr 2025

MASS: MoErging through Adaptive Subspace Selection

Donato Crisostomi

Alessandro Zirilli

Antonio Andrea Gargiulo

Maria Sofia Bucarelli

293

06 Apr 2025

Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models

561

03 Apr 2025

Embedding Shift Dissection on CLIP: Effects of Augmentations on VLM's Representation Learning

354

30 Mar 2025

Attribute-formed Class-specific Concept Space: Endowing Language Bottleneck Model with Better Interpretability and ScalabilityComputer Vision and Pattern Recognition (CVPR), 2025

297

26 Mar 2025

fine-CLIP: Enhancing Zero-Shot Fine-Grained Surgical Action Recognition with Vision-Language Models

252

25 Mar 2025

An Iterative Feedback Mechanism for Improving Natural Language Class Descriptions in Open-Vocabulary Object Detection

227

21 Mar 2025

Representational Similarity via Interpretable Visual ConceptsInternational Conference on Learning Representations (ICLR), 2025

985

19 Mar 2025

CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity QuantificationComputer Vision and Pattern Recognition (CVPR), 2025

306

19 Mar 2025

Backdooring CLIP through Concept Confusion

332

12 Mar 2025

Interpreting CLIP with Hierarchical Sparse Autoencoders

Vladimir Zaigrajew

Hubert Baniecki

P. Biecek

491

27 Feb 2025

The Role of Background Information in Reducing Object Hallucination in Vision-Language Models: Insights from Cutoff API Prompting

191

24 Feb 2025

Narrowing Information Bottleneck Theory for Multimodal Image-Text Representations InterpretabilityInternational Conference on Learning Representations (ICLR), 2025

269

16 Feb 2025

Trustworthy AI: Safety, Bias, and Privacy -- A Survey

379

11 Feb 2025

Padding Tone: A Mechanistic Analysis of Padding Tokens in T2I ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

242

12 Jan 2025

Visual Large Language Models for Generalized and Specialized Applications

465

06 Jan 2025

A Review of Multimodal Explainable Artificial Intelligence: Past, Present and Future

389

18 Dec 2024

Attention Head Purification: A New Perspective to Harness CLIP for Domain Generalization

Yingfan Wang

Guoliang Kang

VLM

385

10 Dec 2024

Language Model as Visual ExplainerNeural Information Processing Systems (NeurIPS), 2024

Xingyi Yang

Xinchao Wang

VLM

209

08 Dec 2024

Explainable and Interpretable Multimodal Large Language Models: A Comprehensive Survey

...

430

03 Dec 2024

Interpreting Object-level Foundation Models via Visual Precision SearchComputer Vision and Pattern Recognition (CVPR), 2024

580

25 Nov 2024

Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention LensComputer Vision and Pattern Recognition (CVPR), 2024

532

23 Nov 2024

ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements

645

18 Nov 2024

Understanding Multimodal LLMs: the Mechanistic Interpretability of Llava in Visual Question Answering

Zeping Yu

Sophia Ananiadou

1.1K

17 Nov 2024

Decoding Dark Matter: Specialized Sparse Autoencoders for Interpreting Rare Concepts in Foundation ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

Aashiq Muhamed

Mona Diab

Virginia Smith

248

01 Nov 2024

Beyond Accuracy: Ensuring Correct Predictions With Correct RationalesNeural Information Processing Systems (NeurIPS), 2024

Tang Li

Mengmeng Ma

Xi Peng

387

31 Oct 2024

ResiDual Transformer Alignment with Spectral Decomposition

560

31 Oct 2024

Focus On This, Not That! Steering LLMs with Adaptive Feature Specification

548

30 Oct 2024

MoH: Multi-Head Attention as Mixture-of-Head AttentionInternational Conference on Machine Learning (ICML), 2024

416

15 Oct 2024

Robust AI-Generated Text Detection by Restricted EmbeddingsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Serguei Barannikov

184

10 Oct 2024

Towards Interpreting Visual Information Processing in Vision-Language ModelsInternational Conference on Learning Representations (ICLR), 2024

536

09 Oct 2024

Interpreting and Editing Vision-Language Representations to Mitigate HallucinationsInternational Conference on Learning Representations (ICLR), 2024

413

03 Oct 2024

Explanation Bottleneck ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

Shinýa Yamaguchi

Kosuke Nishida

LRM BDL

379

26 Sep 2024

Attention Prompting on Image for Large Vision-Language ModelsEuropean Conference on Computer Vision (ECCV), 2024

Runpeng Yu

Weihao Yu

Xinchao Wang

VLM

398

25 Sep 2024

Quantifying and Enabling the Interpretability of CLIP-like Models

224

10 Sep 2024

Graph-based Unsupervised Disentangled Representation Learning via Multimodal Large Language Models

265

26 Jul 2024

ClearCLIP: Decomposing CLIP Representations for Dense Vision-Language Inference

Yiping Ke

334

17 Jul 2024

Interpretability in Action: Exploratory Analysis of VPT, a Minecraft Agent

Mohammad Reza Samsami

302

16 Jul 2024

FALIP: Visual Prompt as Foveal Attention Boosts CLIP Zero-Shot Performance

330

08 Jul 2024

AlignedCut: Visual Concepts Discovery on Brain-Guided Universal Feature Space

Huzheng Yang

James Gee

Jianbo Shi

VOS

169

26 Jun 2024

Transcoders Find Interpretable LLM Feature Circuits

Jacob Dunefsky

Philippe Chlenski

Neel Nanda

220

17 Jun 2024

MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model

Xuming Hu

266

17 Jun 2024

Concept-skill Transferability-based Data Selection for Large Vision-Language Models

Jaewoo Lee

Boyang Li

Sung Ju Hwang

VLM

298

16 Jun 2024

Fine-Grained Domain Generalization with Feature Structuralization

Wenlong Yu

Dongyue Chen

Qilong Wang

Qinghua Hu

357

13 Jun 2024

A Concept-Based Explainability Framework for Large Multimodal Models

270

12 Jun 2024