Simple, Scalable Adaptation for Neural Machine Translation

18 September 2019

Papers citing "Simple, Scalable Adaptation for Neural Machine Translation"

50 / 256 papers shown

Title
Omni-SMoLA: Boosting Generalist Multimodal Models with Soft Mixture of Low-rank Experts Jialin Wu Xia Hu Yaqing Wang Bo Pang Radu Soricut MoE 19 14 0 01 Dec 2023
ADAPTER-RL: Adaptation of Any Agent using Reinforcement Learning Yi-Fan Jin Greg Slabaugh Simon Lucas OnRL AI4CE 10 0 0 20 Nov 2023
Language and Task Arithmetic with Parameter-Efficient Layers for Zero-Shot Summarization Alexandra Chronopoulou Jonas Pfeiffer Joshua Maynez Xinyi Wang Sebastian Ruder Priyanka Agrawal MoMe 26 14 0 15 Nov 2023
On the Robustness of Question Rewriting Systems to Questions of Varying Hardness Hai Ye Hwee Tou Ng Wenjuan Han 32 3 0 12 Nov 2023
Towards a Deep Understanding of Multilingual End-to-End Speech Translation Haoran Sun Xiaohu Zhao Yikun Lei Shaolin Zhu Deyi Xiong 37 8 0 31 Oct 2023
StyleBART: Decorate Pretrained Model with Style Adapters for Unsupervised Stylistic Headline Generation Hanqing Wang Yajing Luo Boya Xiong Guanhua Chen Yun-Nung Chen 30 0 0 26 Oct 2023
MACP: Efficient Model Adaptation for Cooperative Perception Yunsheng Ma Juanwu Lu Can Cui Sicheng Zhao Xu Cao Wenqian Ye Ziran Wang 24 11 0 25 Oct 2023
Improving generalization in large language models by learning prefix subspaces Louis Falissard Vincent Guigue Laure Soulier 18 1 0 24 Oct 2023
Empirical study of pretrained multilingual language models for zero-shot cross-lingual knowledge transfer in generation Nadezhda Chirkova Sheng Liang Vassilina Nikoulina 19 0 0 15 Oct 2023
BLIP-Adapter: Parameter-Efficient Transfer Learning for Mobile Screenshot Captioning Ching-Yu Chiang I-Hua Chang Shih-Wei Liao 44 1 0 26 Sep 2023
Domain Adaptation for Arabic Machine Translation: The Case of Financial Texts Emad A. Alghamdi Jezia Zakraoui Fares A. Abanmy 29 1 0 22 Sep 2023
Neural Machine Translation Models Can Learn to be Few-shot Learners Raphael Reinauer P. Simianer Kaden Uhlig Johannes E. M. Mosig Joern Wuebker LRM 21 8 0 15 Sep 2023
How Transferable are Attribute Controllers on Pretrained Multilingual Translation Models? Danni Liu Jan Niehues 16 3 0 15 Sep 2023
Mitigating Hallucinations and Off-target Machine Translation with Source-Contrastive and Language-Contrastive Decoding Rico Sennrich Jannis Vamvas Alireza Mohammadshahi HILM 27 38 0 13 Sep 2023
Hydra: Multi-head Low-rank Adaptation for Parameter Efficient Fine-tuning Sanghyeon Kim Hyunmo Yang Younghyun Kim Youngjoon Hong Eunbyung Park AI4CE 24 16 0 13 Sep 2023
Measuring Catastrophic Forgetting in Cross-Lingual Transfer Paradigms: Exploring Tuning Strategies Boshko Koloski Blaž Škrlj Marko Robnik-Šikonja Senja Pollak CLL 21 2 0 12 Sep 2023
Pushing Mixture of Experts to the Limit: Extremely Parameter Efficient MoE for Instruction Tuning Ted Zadouri A. Ustun Arash Ahmadian Beyza Ermics Acyr F. Locatelli Sara Hooker MoE 35 88 0 11 Sep 2023
Epi-Curriculum: Episodic Curriculum Learning for Low-Resource Domain Adaptation in Neural Machine Translation Keyu Chen Zhuang Di Mingchen Li J. M. Chang 22 3 0 06 Sep 2023
UniPT: Universal Parallel Tuning for Transfer Learning with Efficient Parameter and Memory Haiwen Diao Bo Wan Wenjie Qu Xuecong Jia Huchuan Lu Long Chen VLM 31 18 0 28 Aug 2023
MISSRec: Pre-training and Transferring Multi-modal Interest-aware Sequence Representation for Recommendation Jinpeng Wang Ziyun Zeng Yunxiao Wang Yuting Wang Xingyu Lu Tianxiang Li Jun Yuan Rui Zhang Haitao Zheng Shutao Xia 36 43 0 22 Aug 2023
Comparison between parameter-efficient techniques and full fine-tuning: A case study on multilingual news article classification Olesya Razuvayevskaya Ben Wu João A. Leite Freddy Heppell Ivan Srba Carolina Scarton Kalina Bontcheva Xingyi Song 22 8 0 14 Aug 2023
Pluggable Neural Machine Translation Models via Memory-augmented Adapters Yuzhuang Xu Shuo Wang Peng Li Xuebo Liu Xiaolong Wang Weidong Liu Yang Liu 32 1 0 12 Jul 2023
Scaling In-Context Demonstrations with Structured Attention Tianle Cai Kaixuan Huang Jason D. Lee Mengdi Wang LRM 31 8 0 05 Jul 2023
On Conditional and Compositional Language Model Differentiable Prompting Jonathan Pilault Can Liu Joey Tianyi Zhou Markus Dreyer 22 1 0 04 Jul 2023
Learning to Modulate pre-trained Models in RL Thomas Schmied M. Hofmarcher Fabian Paischer Razvan Pascanu Sepp Hochreiter CLL OffRL 24 14 0 26 Jun 2023
Efficient Adapters for Giant Speech Models Nanxin Chen Izhak Shafran Yu Zhang Chung-Cheng Chiu H. Soltau James Qin Yonghui Wu 22 10 0 13 Jun 2023
NAVER LABS Europe's Multilingual Speech Translation Systems for the IWSLT 2023 Low-Resource Track Edward Gow-Smith Alexandre Berard Marcely Zanon Boito Ioan Calapodescu 18 12 0 13 Jun 2023
Learning Multilingual Sentence Representations with Cross-lingual Consistency Regularization Pengzhi Gao Liwen Zhang Zhongjun He Hua-Hong Wu Haifeng Wang 33 6 0 12 Jun 2023
INK: Injecting kNN Knowledge in Nearest Neighbor Machine Translation Wenhao Zhu Jingjing Xu Shujian Huang Lingpeng Kong Jiajun Chen 30 11 0 10 Jun 2023
KIT's Multilingual Speech Translation System for IWSLT 2023 Danni Liu Thai-Binh Nguyen Sai Koneru Enes Yavuz Ugan Ngoc-Quan Pham Tuan-Nam Nguyen Tu Anh Dinh Carlos Mullov A. Waibel J. Niehues 18 6 0 08 Jun 2023
Cross-Lingual Transfer with Target Language-Ready Task Adapters Marinela Parović Alan Ansell Ivan Vulić Anna Korhonen 30 8 0 05 Jun 2023
Domain Specialization as the Key to Make Large Language Models Disruptive: A Comprehensive Survey Chen Ling Xujiang Zhao Jiaying Lu Chengyuan Deng Can Zheng ... Chris White Quanquan Gu Jian Pei Carl Yang Liang Zhao ALM 25 126 0 30 May 2023
Bridging the Domain Gaps in Context Representations for k-Nearest Neighbor Neural Machine Translation Zhiwei Cao Baosong Yang Huan Lin Suhang Wu Xiangpeng Wei Dayiheng Liu Jun Xie Min Zhang Jinsong Su 23 2 0 26 May 2023
Neural Architecture Search for Parameter-Efficient Fine-tuning of Large Pre-trained Language Models Neal Lawton Anoop Kumar Govind Thattai Aram Galstyan Greg Ver Steeg 17 16 0 26 May 2023
LIMIT: Language Identification, Misidentification, and Translation using Hierarchical Models in 350+ Languages M. Agarwal Md Mahfuz Ibn Alam Antonios Anastasopoulos 25 5 0 23 May 2023
mmT5: Modular Multilingual Pre-Training Solves Source Language Hallucinations Jonas Pfeiffer Francesco Piccinno Massimo Nicosia Xinyi Wang Machel Reid Sebastian Ruder VLM LRM 34 27 0 23 May 2023
In-Context Probing: Toward Building Robust Classifiers via Probing Large Language Models Afra Amini Massimiliano Ciaramita ReLM 17 1 0 23 May 2023
Condensing Multilingual Knowledge with Lightweight Language-Specific Modules Haoran Xu Weiting Tan Shuyue Stella Li Yunmo Chen Benjamin Van Durme Philipp Koehn Kenton W. Murray 11 6 0 23 May 2023
Extrapolating Multilingual Understanding Models as Multilingual Generators Bohong Wu Fei Yuan Hai Zhao Lei Li Jingjing Xu AI4CE 25 2 0 22 May 2023
TADA: Efficient Task-Agnostic Domain Adaptation for Transformers Chia-Chien Hung Lukas Lange Jannik Strötgen 30 9 0 22 May 2023
Communication Efficient Federated Learning for Multilingual Neural Machine Translation with Adapter Yi Liu Xiaohan Bi Lei Li Sishuo Chen Wenkai Yang Xu Sun FedML 27 12 0 21 May 2023
A Comprehensive Analysis of Adapter Efficiency Nandini Mundra Sumanth Doddapaneni Raj Dabre Anoop Kunchukuttan Ratish Puduppully Mitesh M. Khapra 18 10 0 12 May 2023
Incorporating Structured Representations into Pretrained Vision & Language Models Using Scene Graphs Roei Herzig Alon Mendelson Leonid Karlinsky Assaf Arbelle Rogerio Feris Trevor Darrell Amir Globerson VLM 30 31 0 10 May 2023
Label-Free Multi-Domain Machine Translation with Stage-wise Training Fan Zhang Mei Tu Sangha Kim Song Liu Jinyao Yan 13 1 0 06 May 2023
Learning Language-Specific Layers for Multilingual Machine Translation Telmo Pires Robin M. Schmidt Yi-Hsiu Liao Stephan Peitz 42 16 0 04 May 2023
Task-Optimized Adapters for an End-to-End Task-Oriented Dialogue System Namo Bang Jeehyun Lee M. Koo 170 37 0 04 May 2023
An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Models Varun Gumma Raj Dabre Pratyush Kumar 22 4 0 19 Apr 2023
Towards Foundation Models and Few-Shot Parameter-Efficient Fine-Tuning for Volumetric Organ Segmentation Julio Silva-Rodríguez Jose Dolz Ismail Ben Ayed 66 13 0 29 Mar 2023
eP-ALM: Efficient Perceptual Augmentation of Language Models Mustafa Shukor Corentin Dancette Matthieu Cord MLLM VLM 32 29 0 20 Mar 2023
SheffieldVeraAI at SemEval-2023 Task 3: Mono and multilingual approaches for news genre, topic and persuasion technique classification Ben Wu Olesya Razuvayevskaya Freddy Heppell João A. Leite Carolina Scarton Kalina Bontcheva Xingyi Song 11 9 0 16 Mar 2023