Neural Machine Translation of Rare Words with Subword Units

31 August 2015

Papers citing "Neural Machine Translation of Rare Words with Subword Units"

50 / 3,808 papers shown

Title
Evaluating Structural Generalization in Neural Machine Translation Ryoma Kumon Daiki Matsuoka Hitomi Yanaka NAI 41 2 0 19 Jun 2024
How effective is Multi-source pivoting for Translation of Low Resource Indian Languages? Pranav Gaikwad Meet Doshi Raj Dabre Pushpak Bhattacharyya 31 0 0 19 Jun 2024
Learning Translations via Matrix Completion Derry Wijaya Brendan Callahan John Hewitt Jie Gao Xiao Ling Marianna Apidianaki Chris Callison-Burch 39 19 0 19 Jun 2024
Learning to Generate Answers with Citations via Factual Consistency Models Rami Aly Zhiqiang Tang Samson Tan George Karypis HILM 42 5 0 19 Jun 2024
ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools Team GLM : Aohan Zeng Bin Xu Bowen Wang ... Zhaoyu Wang Zhen Yang Zhengxiao Du Zhenyu Hou Zihan Wang ALM 79 515 0 18 Jun 2024
Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for Ensembling Yao-Ching Yu Chun-Chih Kuo Ziqi Ye Yu-Cheng Chang Yueh-Se Li 56 9 0 18 Jun 2024
GPT Czech Poet: Generation of Czech Poetic Strophes with Language Models Michal Chudoba Rudolf Rosa 51 2 0 18 Jun 2024
Tokenization Falling Short: The Curse of Tokenization Yekun Chai Yewei Fang Qiwei Peng Xuhong Li 52 1 0 17 Jun 2024
Towards an End-to-End Framework for Invasive Brain Signal Decoding with Large Language Models Sheng Feng Heyang Liu Yu Wang Yanfeng Wang 24 3 0 17 Jun 2024
GigaSpeech 2: An Evolving, Large-Scale and Multi-domain ASR Corpus for Low-Resource Languages with Automated Crawling, Transcription and Refinement Yifan Yang Zheshu Song Jianheng Zhuo Mingyu Cui Jinpeng Li ... Shuai Fan Kai Yu Wei-Qiang Zhang Guoguo Chen Xie Chen 37 8 0 17 Jun 2024
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning Zebang Cheng Zhi-Qi Cheng Jun-Yan He Jingdong Sun Kai Wang Yuxiang Lin Zheng Lian Xiaojiang Peng Alexander G. Hauptmann MLLM 40 31 0 17 Jun 2024
Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation Boxuan Lyu Hidetaka Kamigaito Kotaro Funakoshi Manabu Okumura 43 0 0 17 Jun 2024
Leading Whitespaces of Language Models' Subword Vocabulary Poses a Confound for Calculating Word Probabilities Byung-Doh Oh William Schuler 35 14 0 16 Jun 2024
Large Language Models for Automatic Milestone Detection in Group Discussions Zhuoxu Duan Zhengye Yang Samuel Westby Christoph Riedl B. F. Welles Richard J. Radke 30 0 0 16 Jun 2024
HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies William Watson Nicole Cho T. Balch Manuela Veloso LMTD 33 0 0 16 Jun 2024
Quantifying Generative Media Bias with a Corpus of Real-world and Generated News Articles Filip Trhlik Pontus Stenetorp 35 6 0 16 Jun 2024
Multilingual Large Language Models and Curse of Multilinguality Daniil Gurgurov Tanja Bäumel Tatiana Anikina 86 4 0 15 Jun 2024
BEACON: Benchmark for Comprehensive RNA Tasks and Language Models Yuchen Ren Zhiyuan Chen Lifeng Qiao Hongtai Jing Yuchen Cai ... Siqi Sun Hongliang Yan Dong Yuan Wanli Ouyang Xihui Liu 52 9 0 14 Jun 2024
Vision Language Modeling of Content, Distortion and Appearance for Image Quality Assessment Fei Zhou Zhicong Huang Tianhao Gu Guoping Qiu CoGe VLM 69 1 0 14 Jun 2024
TabularFM: An Open Framework For Tabular Foundational Models Quan M. Tran Suong N. Hoang Lam M. Nguyen Dzung Phan Hoang Thanh Lam LMTD 32 1 0 14 Jun 2024
Optimizing Byte-level Representation for End-to-end ASR Roger Hsiao Liuhui Deng Erik McDermott R. Travadi Xiaodan Zhuang 29 0 0 14 Jun 2024
Why Warmup the Learning Rate? Underlying Mechanisms and Improvements Dayal Singh Kalra M. Barkeshli 57 7 0 13 Jun 2024
Bioptic -- A Target-Agnostic Potency-Based Small Molecules Search Engine Vlad Vinogradov Ivan Izmailov Simon Steshin Kong T. Nguyen 31 0 0 13 Jun 2024
Investigating the translation capabilities of Large Language Models trained on parallel data only Javier García Gilabert Carlos Escolano Aleix Sant Savall Francesca de Luca Fornaciari Audrey Mash Xixian Liao Maite Melero LRM 44 2 0 13 Jun 2024
Language Models are Crossword Solvers Soumadeep Saha Sutanoya Chakraborty Saptarshi Saha Utpal Garain LRM ReLM 59 2 0 13 Jun 2024
To be Continuous, or to be Discrete, Those are Bits of Questions Yiran Wang Masao Utiyama 53 2 0 12 Jun 2024
On the Hallucination in Simultaneous Machine Translation M. Zhong Kehai Chen Zhengshan Xue Lemao Liu Mingming Yang Min Zhang HILM LRM 44 0 0 11 Jun 2024
Fast Context-Biasing for CTC and Transducer ASR models with CTC-based Word Spotter A. Andrusenko A. Laptev Vladimir Bataev Vitaly Lavrukhin Boris Ginsburg 45 0 0 11 Jun 2024
Scaling the Vocabulary of Non-autoregressive Models for Efficient Generative Retrieval Ravisri Valluri Akash Kumar Mohankumar Kushal Dave Amit Singh Jian Jiao Manik Varma Gaurav Sinha 66 1 0 10 Jun 2024
Label-Looping: Highly Efficient Decoding for Transducers Vladimir Bataev Hainan Xu Daniel Galvez Vitaly Lavrukhin Boris Ginsburg 42 5 0 10 Jun 2024
Efficient k-Nearest-Neighbor Machine Translation with Dynamic Retrieval Yan Gao Zhiwei Cao Zhongjian Miao Baosong Yang Shiyu Liu Min Zhang Jinsong Su 42 0 0 10 Jun 2024
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension Khiem Le Zhichun Guo Kaiwen Dong Xiaobao Huang B. Nan Roshni G. Iyer Xiangliang Zhang Olaf Wiest Wei Wang Nitesh Chawla 46 8 0 10 Jun 2024
Attention as a Hypernetwork Simon Schug Seijin Kobayashi Yassir Akram João Sacramento Razvan Pascanu GNN 37 3 0 09 Jun 2024
Exploring the Benefits of Tokenization of Discrete Acoustic Units Avihu Dekel Raul Fernandez 49 2 0 08 Jun 2024
Relational Proxy Loss for Audio-Text based Keyword Spotting Youngmoon Jung Seungjin Lee Joon-Young Yang Jaeyoung Roh C. Han Hoon-Young Cho 40 0 0 08 Jun 2024
Language models emulate certain cognitive profiles: An investigation of how predictability measures interact with individual differences Patrick Haller Lena S. Bolliger Lena Ann Jäger 42 1 0 07 Jun 2024
Large Language Model-guided Document Selection Xiang Kong Tom Gunter Ruoming Pang 41 4 0 07 Jun 2024
Decoder-only Streaming Transformer for Simultaneous Translation Shoutao Guo Shaolei Zhang Yang Feng 39 4 0 06 Jun 2024
Attribute-Aware Implicit Modality Alignment for Text Attribute Person Search Xin Wang Fangfang Liu Zheng Li Caili Guo 46 1 0 06 Jun 2024
What is the Best Way for ChatGPT to Translate Poetry? Shanshan Wang Derek F. Wong Jingming Yao Lidia S. Chao 33 4 0 05 Jun 2024
Enhancing CTC-based speech recognition with diverse modeling units Shiyi Han Zhihong Lei Mingbin Xu Xingyu Na Zhen Huang 41 0 0 05 Jun 2024
LCS: A Language Converter Strategy for Zero-Shot Neural Machine Translation Zengkui Sun Yijin Liu Fandong Meng Jinan Xu Jinan Xu Jie Zhou 47 2 0 05 Jun 2024
Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following Qiaomu Miao Alexandros Graikos Jingwei Zhang Sounak Mondal Minh Hoai Dimitris Samaras 45 0 0 04 Jun 2024
Self-Modifying State Modeling for Simultaneous Machine Translation Donglei Yu Xiaomian Kang Yuchen Liu Yu Zhou Chengqing Zong LRM 43 5 0 04 Jun 2024
Edit Distance Robust Watermarks for Language Models Noah Golowich Ankur Moitra AAML WaLM 47 5 0 04 Jun 2024
Explicitly Encoding Structural Symmetry is Key to Length Generalization in Arithmetic Tasks Mahdi Sabbaghi George Pappas Hamed Hassani Surbhi Goel 45 4 0 04 Jun 2024
Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision Saierdaer Yusuyin Te Ma Hao Huang Wenbo Zhao Zhijian Ou 52 2 0 04 Jun 2024
Multi-word Term Embeddings Improve Lexical Product Retrieval Viktor Shcherbakov Fedor Krasnov 28 0 0 03 Jun 2024
YODAS: Youtube-Oriented Dataset for Audio and Speech Xinjian Li Shinnosuke Takamichi Takaaki Saeki William Chen Sayaka Shiota Shinji Watanabe 45 17 0 02 Jun 2024
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models Zicheng Liu Jiahui Li Siyuan Li Z. Zang Cheng Tan Yufei Huang Yajing Bai Stan Z. Li ELM 37 8 0 01 Jun 2024