Title
Defining Boundaries: The Impact of Domain Specification on Cross-Language and Cross-Domain Transfer in Machine Translation Lia Shahnazaryan Meriem Beloucif 56 0 0 21 Aug 2024
IKUN for WMT24 General MT Task: LLMs Are here for Multilingual Machine Translation Baohao Liao Christian Herold Shahram Khadivi Christof Monz 73 5 0 21 Aug 2024
Expanding FLORES+ Benchmark for more Low-Resource Settings: Portuguese-Emakhuwa Machine Translation Evaluation Felermino D. M. Antonio Ali Henrique Lopes Cardoso R. Sousa-Silva 41 0 0 21 Aug 2024
MoE-LPR: Multilingual Extension of Large Language Models through Mixture-of-Experts with Language Priors Routing Hao Zhou Zhijun Wang Shujian Huang Xin Huang Xue Han Junlan Feng Chao Deng Weihua Luo Jiajun Chen CLL MoE 84 6 0 21 Aug 2024
Synergistic Approach for Simultaneous Optimization of Monolingual, Cross-lingual, and Multilingual Information Retrieval Adel Elmahdy Sheng-Chieh Lin Amin Ahmad 83 2 0 20 Aug 2024
Goldfish: Monolingual Language Models for 350 Languages Tyler A. Chang Catherine Arnett Zhuowen Tu Benjamin Bergen LRM 132 10 0 19 Aug 2024
Understanding Generative AI Content with Embedding Models Max Vargas Reilly Cannon A. Engel Anand D. Sarwate Tony Chiang 217 3 0 19 Aug 2024
ChatZero:Zero-shot Cross-Lingual Dialogue Generation via Pseudo-Target Language Yongkang Liu Feng Shi Daling Wang Yifei Zhang Hinrich Schütze 77 1 0 16 Aug 2024
FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data Haoran Sun Renren Jin Shaoyang Xu Leiyu Pan Supryadi ... Lei Yang Ling Shi Juesi Xiao Shaolin Zhu Deyi Xiong 87 4 0 12 Aug 2024
Mitigating Multilingual Hallucination in Large Vision-Language Models Xiaoye Qu Mingyang Song Xiaoye Qu Jianfeng Dong Yu Cheng VLM LRM 85 2 0 01 Aug 2024
In-Context Example Selection via Similarity Search Improves Low-Resource Machine Translation Joel Witzke Benoît Sagot Rachel Bawden 113 10 0 01 Aug 2024
Navigating Text-to-Image Generative Bias across Indic Languages S. Mittal Arnav Sudan Mayank Vatsa Richa Singh Tamar Glaser Tal Hassner EGVM 133 2 0 01 Aug 2024
Data Contamination Report from the 2024 CONDA Shared Task Oscar Sainz Iker García-Ferrero Alon Jacovi Jonas Hanselle Yanai Elazar ... Yu-Min Tseng Vishaal Udandarao Zengzhi Wang Ruijie Xu Jinglin Yang 114 6 0 31 Jul 2024
Generating Gender Alternatives in Machine Translation Sarthak Garg Mozhdeh Gheini Clara Emmanuel Tatiana Likhomanenko Qin Gao Matthias Paulik 67 4 0 29 Jul 2024
SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages Wenxuan Zhang Hou Pong Chan Yiran Zhao Mahani Aljunied Jianyu Wang ... Zhiqiang Hu Weiwen Xu Yew Ken Chia Xin Li Li Bing LRM 145 15 0 29 Jul 2024
The power of Prompts: Evaluating and Mitigating Gender Bias in MT with LLMs Aleix Sant Carlos Escolano Audrey Mash Francesca de Luca Fornaciari Maite Melero 73 6 0 26 Jul 2024
Machine Translation Hallucination Detection for Low and High Resource Languages using Large Language Models Kenza Benkirane Laura Gongas Shahar Pelles Naomi Fuchs Joshua Darmon Pontus Stenetorp David Ifeoluwa Adelani Eduardo Sánchez HILM 78 6 0 23 Jul 2024
Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words Yijie Chen Yijin Liu Fandong Meng Jinan Xu Jinan Xu Jie Zhou 58 1 0 23 Jul 2024
Fine-grained Gender Control in Machine Translation with Large Language Models Minwoo Lee Hyukhun Koh Minsu Kim Kyomin Jung 62 2 0 21 Jul 2024
Modular Sentence Encoders: Separating Language Specialization from Cross-Lingual Alignment Yongxin Huang Kexin Wang Goran Glavaš Iryna Gurevych 100 1 0 20 Jul 2024
CoVoSwitch: Machine Translation of Synthetic Code-Switched Text Based on Intonation Units Yeeun Kang 78 1 0 19 Jul 2024
Towards Zero-Shot Multimodal Machine Translation Matthieu Futeral Cordelia Schmid Benoît Sagot Rachel Bawden 106 4 0 18 Jul 2024
LLMs-in-the-loop Part-1: Expert Small AI Models for Bio-Medical Text Translation Bunyamin Keles Murat Gunay Serdar I. Caglar LM&MA 60 2 0 16 Jul 2024
Scaling Sign Language Translation Biao Zhang Garrett Tanzer Orhan Firat LRM VLM SLR 85 1 0 16 Jul 2024
Boosting Zero-Shot Crosslingual Performance using LLM-Based Augmentations with Effective Data Selection Barah Fazili Ashish Agrawal Preethi Jyothi 74 2 0 15 Jul 2024
Exploring the Effectiveness of Methods for Persona Extraction Konstantin Zaitsev 56 0 0 12 Jul 2024
LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages Yinquan Lu Wenhao Zhu Lei Li Yu Qiao Fei Yuan 94 32 0 08 Jul 2024
An Empirical Comparison of Vocabulary Expansion and Initialization Approaches for Language Models Nandini Mundra Aditya Nanda Kishore Raj Dabre Ratish Puduppully Anoop Kunchukuttan Mitesh Khapra 70 7 0 08 Jul 2024
LLMBox: A Comprehensive Library for Large Language Models Tianyi Tang Yiwen Hu Bingqian Li Wenyang Luo Zijing Qin ... Chunxuan Xia Junyi Li Kun Zhou Wayne Xin Zhao Ji-Rong Wen 65 2 0 08 Jul 2024
LEVOS: Leveraging Vocabulary Overlap with Sanskrit to Generate Technical Lexicons in Indian Languages Karthika N J Krishnakant Bhatt Ganesh Ramakrishnan Preethi Jyothi 83 1 0 08 Jul 2024
A Principled Framework for Evaluating on Typologically Diverse Languages Esther Ploeger Wessel Poelman Andreas Holck Høeg-Petersen Anders Schlichtkrull Miryam de Lhoneux Johannes Bjerva 129 1 0 06 Jul 2024
Toucan: Many-to-Many Translation for 150 African Language Pairs AbdelRahim Elmadany Ife Adebara Muhammad Abdul-Mageed 68 3 0 05 Jul 2024
Unlocking the Potential of Model Merging for Low-Resource Languages Mingxu Tao Chen Zhang Quzhe Huang Tianyao Ma Songfang Huang Dongyan Zhao Yansong Feng CLL MoMe 78 5 0 04 Jul 2024
Finetuning End-to-End Models for Estonian Conversational Spoken Language Translation Tiia Sildam Andra Velve Tanel Alumäe 102 0 0 04 Jul 2024
How Does Quantization Affect Multilingual LLMs? Kelly Marchisio Saurabh Dash Hongyu Chen Dennis Aumiller Ahmet Üstün Sara Hooker Sebastian Ruder MQ 125 15 0 03 Jul 2024
Investigating Decoder-only Large Language Models for Speech-to-text Translation Chao-Wei Huang Hui Lu Hongyu Gong Hirofumi Inaguma Ilia Kulikov Ruslan Mavlyutov Sravya Popuri AuLLM LRM 100 8 0 03 Jul 2024
Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data Minato Kondo T. Utsuro Masaaki Nagata CLL 76 5 0 03 Jul 2024
Nollywood: Let's Go to the Movies! John E. Ortega Ibrahim Said Ahmad William Chen 53 0 0 02 Jul 2024
Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Vision-Language Models Joan Nwatu Oana Ignat Rada Mihalcea 68 0 0 02 Jul 2024
RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs John Dang Arash Ahmadian Kelly Marchisio Julia Kreutzer Ahmet Üstün Sara Hooker 103 28 0 02 Jul 2024
Why do LLaVA Vision-Language Models Reply to Images in English? Musashi Hinck Carolin Holtermann Matthew Lyle Olson Florian Schneider Sungduk Yu Anahita Bhiwandiwalla Anne Lauscher Shaoyen Tseng Vasudev Lal VLM 131 7 0 02 Jul 2024
Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts Chunlan Ma Yihong Liu Haotian Ye Hinrich Schütze 54 2 0 02 Jul 2024
How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise in Machine Translation Yan Meng Di Wu Christof Monz 101 1 0 02 Jul 2024
Retrieval-augmented generation in multilingual settings Nadezhda Chirkova David Rau Hervé Déjean Thibault Formal Stéphane Clinchant Vassilina Nikoulina RALM 72 17 0 01 Jul 2024
Gloss2Text: Sign Language Gloss translation using LLMs and Semantically Aware Label Smoothing Pooya Fayyazsanavi Antonios Anastasopoulos Jana Kosecka SLR 54 1 0 01 Jul 2024
Investigating the potential of Sparse Mixtures-of-Experts for multi-domain neural machine translation Nadezhda Chirkova Vassilina Nikoulina Jean-Luc Meunier Alexandre Berard MoE 69 0 0 01 Jul 2024
Too Late to Train, Too Early To Use? A Study on Necessity and Viability of Low-Resource Bengali LLMs Tamzeed Mahfuz Satak Kumar Dey Ruwad Naswan Hasnaen Adil Khondker Salman Sayeed Haz Sameen Shahgir 71 1 0 29 Jun 2024
A Recipe of Parallel Corpora Exploitation for Multilingual Large Language Models Peiqin Lin André F. T. Martins Hinrich Schütze 163 3 0 29 Jun 2024
Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects Orevaoghene Ahia Anuoluwapo Aremu Diana Abagyan Hila Gonen David Ifeoluwa Adelani Daud Abolade Noah A. Smith Yulia Tsvetkov 139 9 0 27 Jun 2024
SSP: Self-Supervised Prompting for Cross-Lingual Transfer to Low-Resource Languages using Large Language Models Vipul Rathore Aniruddha Deb Ankish Chandresh Parag Singla Mausam LRM 73 0 0 27 Jun 2024