Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1704.05796
Cited By

Network Dissection: Quantifying Interpretability of Deep Visual
Representations

Network Dissection: Quantifying Interpretability of Deep Visual Representations

19 April 2017

Antonio Torralba

ArXiv (abs)PDF HTML

Papers citing "Network Dissection: Quantifying Interpretability of Deep Visual Representations"

50 / 842 papers shown

Mechanistic Finetuning of Vision-Language-Action Models via Few-Shot Demonstrations

Mechanistic Finetuning of Vision-Language-Action Models via Few-Shot Demonstrations

Chancharik Mitra

52

0

0

27 Nov 2025

Auxiliary Metrics Help Decoding Skill Neurons in the Wild

Auxiliary Metrics Help Decoding Skill Neurons in the Wild

345

0

0

26 Nov 2025

Guaranteed Optimal Compositional Explanations for Neurons

Guaranteed Optimal Compositional Explanations for Neurons

Leilani H. Gilpin

76

0

0

25 Nov 2025

Open Vocabulary Compositional Explanations for Neuron Alignment

Open Vocabulary Compositional Explanations for Neuron Alignment

Leilani H. Gilpin

336

0

0

25 Nov 2025

Interpreting GFlowNets for Drug Discovery: Extracting Actionable Insights for Medicinal Chemistry

Interpreting GFlowNets for Drug Discovery: Extracting Actionable Insights for Medicinal Chemistry

Amirtha Varshini A S

Duminda S. Ranasinghe

70

0

0

24 Nov 2025

LAYA: Layer-wise Attention Aggregation for Interpretable Depth-Aware Neural Networks

LAYA: Layer-wise Attention Aggregation for Interpretable Depth-Aware Neural Networks

183

0

0

16 Nov 2025

Probing the Probes: Methods and Metrics for Concept Alignment

Probing the Probes: Methods and Metrics for Concept Alignment

Jacob Lysnæs-Larsen

174

0

0

06 Nov 2025

LLEXICORP: End-user Explainability of Convolutional Neural Networks

LLEXICORP: End-user Explainability of Convolutional Neural Networks

Tomáš Brázdil

89

0

0

04 Nov 2025

Atlas-Alignment: Making Interpretability Transferable Across Language Models

Atlas-Alignment: Making Interpretability Transferable Across Language Models

Sebastian Lapuschkin

417

0

0

31 Oct 2025

ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts

ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts

Steffen Schneider

144

0

0

30 Oct 2025

Finding Culture-Sensitive Neurons in Vision-Language Models

Finding Culture-Sensitive Neurons in Vision-Language Models

Rochelle Choenni

248

0

0

28 Oct 2025

Enhancing Pre-trained Representation Classifiability can Boost its Interpretability

Enhancing Pre-trained Representation Classifiability can Boost its InterpretabilityInternational Conference on Learning Representations (ICLR), 2025

417

4

0

28 Oct 2025

A Video Is Not Worth a Thousand Words

A Video Is Not Worth a Thousand Words

108

0

0

27 Oct 2025

Scaling Non-Parametric Sampling with Representation

Scaling Non-Parametric Sampling with Representation

128

0

0

25 Oct 2025

Automated Detection of Visual Attribute Reliance with a Self-Reflective Agent

Automated Detection of Visual Attribute Reliance with a Self-Reflective Agent

Josep Lopez Camunas

Jake Thomas Touchet

Àgata Lapedriza

Antonio Torralba

Tamar Rott Shaham

195

0

0

24 Oct 2025

EdgeSync: Accelerating Edge-Model Updates for Data Drift through Adaptive Continuous Learning

EdgeSync: Accelerating Edge-Model Updates for Data Drift through Adaptive Continuous Learning

109

0

0

18 Oct 2025

Neologism Learning for Controllability and Self-Verbalization

Neologism Learning for Controllability and Self-Verbalization

87

1

0

09 Oct 2025

Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts

Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts

Yeskendir Koishekenov

Nicola Cancedda

150

1

0

08 Oct 2025

Mysteries of the Deep: Role of Intermediate Representations in Out of Distribution Detection

Mysteries of the Deep: Role of Intermediate Representations in Out of Distribution Detection

I. M. De la Jara

C. Rodriguez-Opazo

351

0

0

07 Oct 2025

Semantic Regexes: Auto-Interpreting LLM Features with a Structured Language

Semantic Regexes: Auto-Interpreting LLM Features with a Structured Language

Yannick Assogba

Arvind Satyanarayan

144

0

0

07 Oct 2025

Take Goodhart Seriously: Principled Limit on General-Purpose AI Optimization

Take Goodhart Seriously: Principled Limit on General-Purpose AI Optimization

96

0

0

03 Oct 2025

Attack logics, not outputs: Towards efficient robustification of deep neural networks by falsifying concept-based properties

Attack logics, not outputs: Towards efficient robustification of deep neural networks by falsifying concept-based properties

Gesina Schwalbe

120

0

0

01 Oct 2025

Mechanistic Interpretability as Statistical Estimation: A Variance Analysis of EAP-IG

Mechanistic Interpretability as Statistical Estimation: A Variance Analysis of EAP-IG

François Portet

166

1

0

01 Oct 2025

TextCAM: Explaining Class Activation Map with Text

TextCAM: Explaining Class Activation Map with Text

121

0

0

01 Oct 2025

Object-Centric Case-Based Reasoning via Argumentation

Object-Centric Case-Based Reasoning via Argumentation

Gabriel de Olim Gaul

93

0

0

30 Sep 2025

Nonparametric Identification of Latent Concepts

Nonparametric Identification of Latent Concepts

224

1

0

30 Sep 2025

Interpret, prune and distill Donut : towards lightweight VLMs for VQA on document

Interpret, prune and distill Donut : towards lightweight VLMs for VQA on document

Adnan Ben Mansour

130

0

0

30 Sep 2025

CE-FAM: Concept-Based Explanation via Fusion of Activation Maps

CE-FAM: Concept-Based Explanation via Fusion of Activation Maps

Michihiro Kuroki

152

0

0

28 Sep 2025

On The Variability of Concept Activation Vectors

On The Variability of Concept Activation Vectors

126

0

0

28 Sep 2025

REMA: A Unified Reasoning Manifold Framework for Interpreting Large Language Model

REMA: A Unified Reasoning Manifold Framework for Interpreting Large Language Model

109

0

0

26 Sep 2025

Interpreting ResNet-based CLIP via Neuron-Attention Decomposition

Interpreting ResNet-based CLIP via Neuron-Attention Decomposition

Yossi Gandelsman

221

0

0

24 Sep 2025

Redefining Experts: Interpretable Decomposition of Language Models for Toxicity Mitigation

Redefining Experts: Interpretable Decomposition of Language Models for Toxicity Mitigation

Zuhair Hasan Shaik

Abdullah Mazhar

Aseem Srivastava

Md. Shad Akhtar

114

0

0

20 Sep 2025

V-CECE: Visual Counterfactual Explanations via Conceptual Edits

V-CECE: Visual Counterfactual Explanations via Conceptual Edits

Nikolaos Spanos

Maria Lymperaiou

Giorgos Filandrianos

Konstantinos Thomas

Athanasios Voulodimos

254

0

0

20 Sep 2025

Which Direction to Choose? An Analysis on the Representation Power of Self-Supervised ViTs in Downstream Tasks

Which Direction to Choose? An Analysis on the Representation Power of Self-Supervised ViTs in Downstream Tasks

Yannis Kaltampanidis

Alexandros Doumanoglou

144

0

0

18 Sep 2025

NeuroStrike: Neuron-Level Attacks on Aligned LLMs

NeuroStrike: Neuron-Level Attacks on Aligned LLMs

Mohamadreza Rostami

Maximilian Thang

239

1

0

15 Sep 2025

Discovering Divergent Representations between Text-to-Image Models

Discovering Divergent Representations between Text-to-Image Models

Joseph E. Gonzalez

Fabian Caba Heilbron

Bryan C. Russell

126

0

0

10 Sep 2025

Superposition in Graph Neural Networks

Superposition in Graph Neural Networks

152

0

0

31 Aug 2025

GCAV: A Global Concept Activation Vector Framework for Cross-Layer Consistency in Interpretability

GCAV: A Global Concept Activation Vector Framework for Cross-Layer Consistency in Interpretability

163

0

0

28 Aug 2025

NM-Hebb: Coupling Local Hebbian Plasticity with Metric Learning for More Accurate and Interpretable CNNs

NM-Hebb: Coupling Local Hebbian Plasticity with Metric Learning for More Accurate and Interpretable CNNs

Davorin Miličević

100

0

0

27 Aug 2025

Disentangling Polysemantic Neurons with a Null-Calibrated Polysemanticity Index and Causal Patch Interventions

Disentangling Polysemantic Neurons with a Null-Calibrated Polysemanticity Index and Causal Patch Interventions

93

0

0

23 Aug 2025

Evaluating Sparse Autoencoders for Monosemantic Representation

Evaluating Sparse Autoencoders for Monosemantic Representation

Moghis Fereidouni

Muhammad Umair Haider

136

0

0

20 Aug 2025

Integrating attention into explanation frameworks for language and vision transformers

Integrating attention into explanation frameworks for language and vision transformers

Jacob Lysnæs-Larsen

83

0

0

12 Aug 2025

Granular Concept Circuits: Toward a Fine-Grained Circuit Discovery for Concept Representations

Granular Concept Circuits: Toward a Fine-Grained Circuit Discovery for Concept Representations

168

1

0

03 Aug 2025

Eigen Neural Network: Unlocking Generalizable Vision with Eigenbasis

Eigen Neural Network: Unlocking Generalizable Vision with Eigenbasis

Shahin Nazarian

223

0

0

02 Aug 2025

Detection Transformers Under the Knife: A Neuroscience-Inspired Approach to Ablations

Detection Transformers Under the Knife: A Neuroscience-Inspired Approach to Ablations

Florian Hölken

172

0

0

29 Jul 2025

Compositional Function Networks: A High-Performance Alternative to Deep Neural Networks with Built-in Interpretability

Compositional Function Networks: A High-Performance Alternative to Deep Neural Networks with Built-in Interpretability

216

0

0

28 Jul 2025

Emergence of Quantised Representations Isolated to Anisotropic Functions

Emergence of Quantised Representations Isolated to Anisotropic Functions

154

1

0

16 Jul 2025

Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models

Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models

Lauren Hyoseo Yoon

379

0

0

01 Jul 2025

When concept-based XAI is imprecise: Do people distinguish between generalisations and misrepresentations?

When concept-based XAI is imprecise: Do people distinguish between generalisations and misrepresentations?

172

1

0

22 Jun 2025

From Concepts to Components: Concept-Agnostic Attention Module Discovery in Transformers

From Concepts to Components: Concept-Agnostic Attention Module Discovery in Transformers

270

3

0

20 Jun 2025

1 2 3 4...15 16 17