v1v2 (latest)

Analyzing the Structure of Attention in a Transformer Language Model

7 June 2019

Jesse Vig

Yonatan Belinkov

ArXiv (abs)PDF HTML

Papers citing "Analyzing the Structure of Attention in a Transformer Language Model"

50 / 226 papers shown

Fisher Information-based Efficient Curriculum Federated Learning with Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Ji Liu

Jiaxiang Ren

Ruoming Jin

Zijie Zhang

Yang Zhou

P. Valduriez

Dejing Dou

FedML

277

30 Sep 2024

Selective Prompt Anchoring for Code Generation

Yuan Tian

Tianyi Zhang

790

17 Aug 2024

Validating Mechanistic Interpretations: An Axiomatic Approach

305

18 Jul 2024

How and where does CLIP process negation?

246

15 Jul 2024

Beyond KV Caching: Shared Attention for Efficient LLMs

Bingli Liao

Danilo Vasconcellos Vargas

207

13 Jul 2024

Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective

307

03 Jul 2024

ESALE: Enhancing Code-Summary Alignment Learning for Source Code Summarization

Quanjun Zhang

Bin Luo

Yang Liu

Zhenyu Chen

AI4TS

301

01 Jul 2024

Confidence Regulation Neurons in Language Models

236

24 Jun 2024

DeciMamba: Exploring the Length Extrapolation Potential of Mamba

514

20 Jun 2024

A Primal-Dual Framework for Transformers and Neural Networks

Tan M. Nguyen

Tam Nguyen

191

19 Jun 2024

290

19 Jun 2024

Unveiling the Hidden Structure of Self-Attention via Kernel Principal Component Analysis

R. Teo

Tan M. Nguyen

354

19 Jun 2024

Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective

240

06 Jun 2024

Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning

298

04 Jun 2024

Language Models Need Inductive Biases to Count Inductively

Yingshan Chang

Yonatan Bisk

LRM

264

30 May 2024

Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation ModelsNeural Information Processing Systems (NeurIPS), 2024

Yuchen Hu

Chen Chen

Chao-Han Huck Yang

Chao Zhang

195

23 May 2024

A Masked Semi-Supervised Learning Approach for Otago Micro Labels Recognition

...

249

21 May 2024

How does Multi-Task Training Affect Transformer In-Context Capabilities? Investigations with Function ClassesNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

107

04 Apr 2024

Using Interpretation Methods for Model EnhancementConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Zhuo Chen

Chengyue Jiang

Kewei Tu

297

02 Apr 2024

Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention

380

17 Mar 2024

Are Human Conversations Special? A Large Language Model Perspective

217

08 Mar 2024

On the Challenges and Opportunities in Generative AI

...

748

28 Feb 2024

What Do Language Models Hear? Probing for Auditory Representations in Language Models

Jerry Ngo

Yoon Kim

AuLLM MILM

186

26 Feb 2024

How Large Language Models Encode Context Knowledge? A Layer-Wise Probing Study

214

25 Feb 2024

CAMELoT: Towards Large Language Models with Training-Free Consolidated Associative Memory

Julian McAuley

198

21 Feb 2024

A Mechanistic Analysis of a Transformer Trained on a Symbolic Multi-Step Reasoning Task

256

19 Feb 2024

Attention with Markov: A Framework for Principled Analysis of Transformers via Markov Chains

Ashok Vardhan Makkuva

382

06 Feb 2024

Attention Meets Post-hoc Interpretability: A Mathematical PerspectiveInternational Conference on Machine Learning (ICML), 2024

Gianluigi Lopardo

F. Precioso

Damien Garreau

249

05 Feb 2024

Transformer-Based Models Are Not Yet Perfect At Learning to Emulate Structural Recursion

240

23 Jan 2024

Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning

248

19 Jan 2024

Model Editing Harms General Abilities of Large Language Models: Regularization to the RescueConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

466

09 Jan 2024

Modeling Uncertainty in Personalized Emotion Prediction with Normalizing Flows

219

10 Dec 2023

Transformers are uninterpretable with myopic methods: a case study with bounded Dyck grammarsNeural Information Processing Systems (NeurIPS), 2023

Kaiyue Wen

Yuchen Li

Bing Liu

Andrej Risteski

282

03 Dec 2023

Mitigating Over-smoothing in Transformers via Regularized Nonlocal FunctionalsNeural Information Processing Systems (NeurIPS), 2023

Tam Nguyen

Tan-Minh Nguyen

Richard G. Baraniuk

182

01 Dec 2023

Linear Log-Normal Attention with Unbiased ConcentrationInternational Conference on Learning Representations (ICLR), 2023

Yury Nahshan

Dor-Joseph Kampeas

E. Haleva

270

22 Nov 2023

Visual Analytics for Generative Transformer Models

213

21 Nov 2023

On the Importance of Step-wise Embeddings for Heterogeneous Clinical Time-Series

219

15 Nov 2023

Legal-HNet: Mixing Legal Long-Context Tokens with Hartley Transform

Daniele Giofré

Sneha Ghantasala

AILaw

142

09 Nov 2023

Uncovering Intermediate Variables in Transformers using Circuit Probing

Michael A. Lepori

Thomas Serre

Ellie Pavlick

388

07 Nov 2023

p-Laplacian Transformer

174

06 Nov 2023

Increasing The Performance of Cognitively Inspired Data-Efficient Language Models via Implicit Structure Building

198

31 Oct 2023

Roles of Scaling and Instruction Tuning in Language Perception: Model vs. Human AttentionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

351

29 Oct 2023

Towards a Mechanistic Interpretation of Multi-Step Reasoning Capabilities of Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

393

23 Oct 2023

REFER: An End-to-end Rationale Extraction Framework for Explanation RegularizationConference on Computational Natural Language Learning (CoNLL), 2023

Mohammad Reza Ghasemi Madani

Pasquale Minervini

239

22 Oct 2023

Plausibility Processing in Transformer Language Models: Focusing on the Role of Attention Heads in GPT

Soo Hyun Ryu

146

20 Oct 2023

Disentangling the Linguistic Competence of Privacy-Preserving BERTBlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP (BlackboxNLP), 2023

Stefan Arnold

Nils Kemmerzell

Annika Schreiner

248

17 Oct 2023

Untying the Reversal Curse via Bidirectional Language Model Editing

290

16 Oct 2023

Interpreting and Exploiting Functional Specialization in Multi-Head Attention under Multi-task LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

212

16 Oct 2023

Rethinking Model Selection and Decoding for Keyphrase Generation with Pre-trained Sequence-to-Sequence ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Di Wu

Wasi Uddin Ahmad

Kai-Wei Chang

239

10 Oct 2023

Breaking Down Word Semantics from Pre-trained Language Models through Layer-wise Dimension Selection

Nayoung Choi

08 Oct 2023