v1v2v3 (latest)

Neural Network Acceptability Judgments

31 May 2018

Alex Warstadt

Amanpreet Singh

Samuel R. Bowman

ArXiv (abs)PDF HTML

Papers citing "Neural Network Acceptability Judgments"

50 / 950 papers shown

AlphaEdit: Null-Space Constrained Knowledge Editing for Language ModelsInternational Conference on Learning Representations (ICLR), 2024

Cunchun Li

Houcheng Jiang

Kun Wang

Yunshan Ma

Shi Jie

Xiangnan He

Tat-Seng Chua

Tat-seng Chua

KELM

525

135

03 Oct 2024

Fisher Information-based Efficient Curriculum Federated Learning with Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Ji Liu

Jiaxiang Ren

Ruoming Jin

Zijie Zhang

Yang Zhou

P. Valduriez

Dejing Dou

FedML

285

30 Sep 2024

Analysing Zero-Shot Readability-Controlled Sentence SimplificationInternational Conference on Computational Linguistics (COLING), 2024

Abdullah Barayan

Jose Camacho-Collados

Fernando Alva-Manchego

233

30 Sep 2024

Exposing Assumptions in AI Benchmarks through Cognitive Modelling

Jonathan H. Rystrøm

Kenneth C. Enevoldsen

183

25 Sep 2024

An Effective, Robust and Fairness-aware Hate Speech Detection Framework

Guanyi Mou

Kyumin Lee

301

25 Sep 2024

Wildlife Product Trading in Online Social Networks: A Case Study on Ivory-Related Product Sales Promotion PostsInternational Conference on Web and Social Media (ICWSM), 2024

Guanyi Mou

Yun Yue

Kyumin Lee

Ziming Zhang

OnRL

25 Sep 2024

Unveiling Language Competence Neurons: A Psycholinguistic Approach to Model InterpretabilityInternational Conference on Computational Linguistics (COLING), 2024

Xufeng Duan

Xinyu Zhou

Bei Xiao

Zhenguang G. Cai

MILM

215

24 Sep 2024

HUT: A More Computation Efficient Fine-Tuning Method With Hadamard Updated Transformation

Geyuan Zhang

Xiaofei Zhou

Chuheng Chen

153

20 Sep 2024

Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language ModelsInternational Conference on Computational Linguistics (COLING), 2024

Xinyu Zhou

Delong Chen

Samuel Cahyawijaya

Xufeng Duan

Zhenguang G. Cai

247

19 Sep 2024

Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing?

Josef Jon

225

15 Sep 2024

Fingerprint Vector: Enabling Scalable and Efficient Model Fingerprint Transfer via Vector Addition

307

13 Sep 2024

DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Models

Maryam Akhavan Aghdam

Hongpeng Jin

Yanzhao Wu

MoE

225

10 Sep 2024

Expanding Expressivity in Transformer Models with MöbiusAttention

Anna-Maria Halacheva

M. Nayyeri

Steffen Staab

219

08 Sep 2024

Task-Specific Directions: Definition, Exploration, and Utilization in Parameter Efficient Fine-Tuning

Chongjie Si

Zhiyi Shi

Shifan Zhang

Xiaokang Yang

Hanspeter Pfister

Wei Shen

ALM

425

02 Sep 2024

Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models

Aradhye Agarwal

Suhas Kamasetty Ramesh

Ayan Sengupta

Tanmoy Chakraborty

325

26 Aug 2024

TReX- Reusing Vision Transformer's Attention for Efficient Xbar-based ComputingIEEE Transactions on Emerging Topics in Computing (IEEE TETC), 2024

Abhishek Moitra

Abhiroop Bhattacharjee

Youngeun Kim

Priyadarshini Panda

ViT

202

22 Aug 2024

Toward the Evaluation of Large Language Models Considering Score Variance across Instruction TemplatesBlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP (BlackBoxNLP), 2024

Yusuke Sakai

Adam Nohejl

Jiangnan Hang

Hidetaka Kamigaito

Taro Watanabe

ELM

291

22 Aug 2024

Crafting Tomorrow's Headlines: Neural News Generation and Detection in English, Turkish, Hungarian, and Persian

202

20 Aug 2024

How to Make the Most of LLMs' Grammatical Knowledge for Acceptability Judgments

Hidetaka Kamigaito

Taro Watanabe

304

19 Aug 2024

LoRA

^2

: Multi-Scale Low-Rank Approximations for Fine-Tuning Large Language Models

177

13 Aug 2024

Generalisation First, Memorisation Second? Memorisation Localisation for Natural Language Classification TasksAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Verna Dankers

Ivan Titov

273

09 Aug 2024

Why Are My Prompts Leaked? Unraveling Prompt Extraction Threats in Customized Large Language Models

440

05 Aug 2024

Task Prompt Vectors: Effective Initialization through Multi-Task Soft-Prompt Transfer

276

02 Aug 2024

mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text RetrievalConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

...

Fei Huang

Min Zhang

321

231

29 Jul 2024

Stress-Testing Long-Context Language Models with Lifelong ICL and Task Haystack

Xiaoyue Xu

Qinyuan Ye

Xiang Ren

320

23 Jul 2024

Reconstruct the Pruned Model without Any Retraining

Shengchao Hu

221

18 Jul 2024

Evaluating Large Language Models with fmeval

Luca Franceschi

232

15 Jul 2024

SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning

Xu Jia

240

10 Jul 2024

Testing learning hypotheses using neural networks by manipulating learning data

Cara Su-Yi Leong

Tal Linzen

208

05 Jul 2024

Efficient Training of Language Models with Compact and Consistent Next Token Distributions

Ashutosh Sathe

Sunita Sarawagi

205

03 Jul 2024

MLKD-BERT: Multi-level Knowledge Distillation for Pre-trained Language Models

143

03 Jul 2024

Survey on Knowledge Distillation for Large Language Models: Methods, Evaluation, and Application

Chuanpeng Yang

Wang Lu

Yao Zhu

Yidong Wang

Yiqiang Chen

284

02 Jul 2024

CPT: Consistent Proxy Tuning for Black-box Optimization

Yong Liu

Chun-Mei Feng

243

01 Jul 2024

Exploring Advanced Large Language Models with LLMsuite

Giorgio Roffo

LLMAG

116

01 Jul 2024

Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation

Hye Ryung Son

Jay-Yoon Lee

168

30 Jun 2024

IDT: Dual-Task Adversarial Attacks for Privacy Protection

Pedro Faustini

Shakila Mahjabin Tonni

219

28 Jun 2024

Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model

Longrong Yang

Dong Shen

Chaoxiang Cai

Fan Yang

422

28 Jun 2024

LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks

...

606

177

26 Jun 2024

Grass: Compute Efficient Low-Memory LLM Training with Structured Sparse Gradients

241

25 Jun 2024

TinyStyler: Efficient Few-Shot Text Style Transfer with Authorship Embeddings

Chris Callison-Burch

307

21 Jun 2024

Information Guided Regularization for Fine-tuning Language Models

279

20 Jun 2024

Open Generative Large Language Models for Galician

215

19 Jun 2024

Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy Interpolation

Jakub Simko

213

18 Jun 2024

GW-MoE: Resolving Uncertainty in MoE Router with Global Workspace Theory

Zili Wang

204

18 Jun 2024

Knowledge Fusion By Evolving Weights of Language Models

222

18 Jun 2024

UBench: Benchmarking Uncertainty in Large Language Models with Multiple Choice Questions

424

18 Jun 2024

Style Transfer with Multi-iteration Preference Optimization

Shuai Liu

Jonathan May

245

17 Jun 2024

FamiCom: Further Demystifying Prompts for Language Models with Task-Agnostic Performance Estimation

Bangzheng Li

Muhao Chen

240

17 Jun 2024

Symmetric Dot-Product Attention for Efficient Training of BERT Language Models

287

10 Jun 2024

SuperPos-Prompt: Enhancing Soft Prompt Tuning of Language Models with Superposition of Multi Token Embeddings

MohammadAli SadraeiJavaeri

169

07 Jun 2024