v1v2v3 (latest)

Data Augmentation and Terminology Integration for Domain-Specific Sinhala-English-Tamil Statistical Machine Translation

5 November 2020

Papers citing "Data Augmentation and Terminology Integration for Domain-Specific Sinhala-English-Tamil Statistical Machine Translation"

13 / 13 papers shown

Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation

322

28 Mar 2025

Improving the quality of Web-mined Parallel Corpora of Low-Resource Languages using Debiasing Heuristics

413

26 Feb 2025

Unsupervised Bilingual Lexicon Induction for Low Resource Languages

Charitha Rathnayake

P. R. S. Thilakarathna

Uthpala Nethmini

Rishemjith Kaur

Surangika Ranathunga

287

22 Dec 2024

A Multi-way Parallel Named Entity Annotated Corpus for English, Tamil and Sinhala

434

03 Dec 2024

SiTSE: Sinhala Text Simplification Dataset and Evaluation

413

02 Dec 2024

Unlocking Parameter-Efficient Fine-Tuning for Low-Resource Language Translation

259

05 Apr 2024

Quality Does Matter: A Detailed Look at the Quality and Utility of Web-Mined Parallel CorporaConference of the European Chapter of the Association for Computational Linguistics (EACL), 2024

310

12 Feb 2024

Leveraging Auxiliary Domain Parallel Data in Intermediate Task Fine-tuning for Low-resource Translation

324

02 Jun 2023

Data Augmentation to Address Out-of-Vocabulary Problem in Low-Resource Sinhala-English Neural Machine TranslationPacific Asia Conference on Language, Information and Computation (PACLIC), 2022

Aloka Fernando

Surangika Ranathunga

249

18 May 2022

Pre-Trained Multilingual Sequence-to-Sequence Models: A Hope for Low-Resource Language Translation?Findings (Findings), 2022

David Ifeoluwa Adelani

Ruisi Su

Arya D. McCarthy

VLM

404

16 Mar 2022

Metric Learning in Multilingual Sentence Similarity Measurement for Document Alignment

145

21 Aug 2021

Samanantar: The Largest Publicly Available Parallel Corpora Collection for 11 Indic LanguagesTransactions of the Association for Computational Linguistics (TACL), 2021

...

440

280

12 Apr 2021

Survey on Publicly Available Sinhala Natural Language Processing Tools and Research

Nisansa de Silva

1.6K

05 Jun 2019