Title
The Multilingual Alignment Prism: Aligning Global and Local Preferences to Reduce Harm Aakanksha Arash Ahmadian Beyza Ermis Seraphina Goldfarb-Tarrant Julia Kreutzer Marzieh Fadaee Sara Hooker 119 39 0 26 Jun 2024
ArzEn-LLM: Code-Switched Egyptian Arabic-English Translation and Speech Recognition Using LLMs Ahmed Heakl Youssef Zaghloul Mennatullah Ali Rania Hossam Walid Gomaa 38 4 0 26 Jun 2024
A Survey on Mixture of Experts in Large Language Models Weilin Cai Juyong Jiang Fan Wang Jing Tang Sunghun Kim Jiayi Huang MoE 75 70 0 26 Jun 2024
Multi-property Steering of Large Language Models with Dynamic Activation Composition Daniel Scalena Gabriele Sarti Malvina Nissim KELM LLMSV AI4CE 89 15 0 25 Jun 2024
Blending LLMs into Cascaded Speech Translation: KIT's Offline Speech Translation System for IWSLT 2024 Sai Koneru Thai-Binh Nguyen Ngoc-Quan Pham Danni Liu Zhaolin Li Alexander Waibel Jan Niehues OffRL 68 4 0 24 Jun 2024
Segment Any Text: A Universal Approach for Robust, Efficient and Adaptable Sentence Segmentation Markus Frohmann Igor Sterner Ivan Vulić Benjamin Minixhofer Markus Schedl VLM 108 20 0 24 Jun 2024
M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models Rishabh Maheshwary Vikas Yadav Hoang Nguyen Khyati Mahajan Sathwik Tejaswi Madhusudhan 135 3 0 24 Jun 2024
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models Lynn Chua Badih Ghazi Yangsibo Huang Pritish Kamath Ravi Kumar Pasin Manurangsi Amer Sinha Chulin Xie Chiyuan Zhang 156 2 0 23 Jun 2024
PARIKSHA : A Large-Scale Investigation of Human-LLM Evaluator Agreement on Multilingual and Multi-Cultural Data Ishaan Watts Varun Gumma Aditya Yadavalli Vivek Seshadri Manohar Swaminathan Sunayana Sitaram ELM 97 9 0 21 Jun 2024
How Well Do LLMs Represent Values Across Cultures? Empirical Analysis of LLM Responses Based on Hofstede Cultural Dimensions Julia Kharchenko Tanya Roosta Aman Chadha Chirag Shah 81 22 0 21 Jun 2024
Exploring Design Choices for Building Language-Specific LLMs Atula Tejaswi Nilesh Gupta Eunsol Choi 109 11 0 20 Jun 2024
xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics Daniil Larionov Mikhail Seleznyov Vasiliy Viskov Alexander Panchenko Steffen Eger 46 3 0 20 Jun 2024
On the Evaluation Practices in Multilingual NLP: Can Machine Translation Offer an Alternative to Human Translations? Rochelle Choenni Sara Rajaee Christof Monz Ekaterina Shutova 80 2 0 20 Jun 2024
SimulSeamless: FBK at IWSLT 2024 Simultaneous Speech Translation Sara Papi Marco Gaido Matteo Negri L. Bentivogli 100 2 0 20 Jun 2024
Selected Languages are All You Need for Cross-lingual Truthfulness Transfer Weihao Liu Ning Wu Wenbiao Ding Shining Liang Ming Gong Dongmei Zhang HILM 66 0 0 20 Jun 2024
Evaluating Large Language Models along Dimensions of Language Variation: A Systematik Invesdigatiom uv Cross-lingual Generalization Niyati Bafna Kenton Murray David Yarowsky 126 2 0 19 Jun 2024
Multilingual Synopses of Movie Narratives: A Dataset for Story Understanding Yidan Sun Jianfei Yu Boyang Li 104 0 0 18 Jun 2024
Self-Distillation for Model Stacking Unlocks Cross-Lingual NLU in 200+ Languages Fabian David Schmidt Philipp Borchert Ivan Vulić Goran Glavaš 76 6 0 18 Jun 2024
Cross-Lingual Unlearning of Selective Knowledge in Multilingual Language Models Minseok Choi Kyunghyun Min Jaegul Choo MU AAML 90 2 0 18 Jun 2024
The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions Stefan Sylvius Wagner Maike Behrendt Marc Ziegele Stefan Harmeling 97 12 0 18 Jun 2024
AnyTrans: Translate AnyText in the Image with Large Scale Models Zhipeng Qian Pei Zhang Baosong Yang Kai Fan Yiwei Ma Derek F. Wong Xiaoshuai Sun Rongrong Ji VLM 83 2 0 17 Jun 2024
How Good are LLMs at Relation Extraction under Low-Resource Scenario? Comprehensive Evaluation Dawulie Jinensibieke M. Maimaiti Wentao Xiao Yuanhang Zheng Xiaobo Wang 93 2 0 17 Jun 2024
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving Bhavani Shankar Preethi Jyothi Pushpak Bhattacharyya 90 1 0 16 Jun 2024
Datasets for Multilingual Answer Sentence Selection Matteo Gabburo S. Campese Federico Agostini Alessandro Moschitti 84 0 0 14 Jun 2024
ProxyLM: Predicting Language Model Performance on Multilingual Tasks via Proxy Models David Anugraha Genta Indra Winata Chenyue Li Patrick Amadeus Irawan En-Shiun Annie Lee 96 8 0 13 Jun 2024
Investigating the translation capabilities of Large Language Models trained on parallel data only Javier García Gilabert Carlos Escolano Aleix Sant Savall Francesca de Luca Fornaciari Audrey Mash Xixian Liao Maite Melero LRM 124 2 0 13 Jun 2024
mOSCAR: A Large-scale Multilingual and Multimodal Document-level Corpus Matthieu Futeral A. Zebaze Pedro Ortiz Suarez Julien Abadji Rémi Lacroix Cordelia Schmid Rachel Bawden Benoît Sagot 169 3 0 13 Jun 2024
TasTe: Teaching Large Language Models to Translate through Self-Reflection Yutong Wang Jiali Zeng Xuebo Liu Fandong Meng Jie Zhou Min Zhang 104 19 0 12 Jun 2024
Languages Transferred Within the Encoder: On Representation Transfer in Zero-Shot Multilingual Translation Zhi Qu Chenchen Ding Taro Watanabe 163 1 0 12 Jun 2024
BertaQA: How Much Do Language Models Know About Local Culture? Julen Etxaniz Gorka Azkune A. Soroa Oier López de Lacalle Mikel Artetxe 106 11 0 11 Jun 2024
MBBQ: A Dataset for Cross-Lingual Comparison of Stereotypes in Generative LLMs Vera Neplenbroek Arianna Bisazza Raquel Fernández 96 8 0 11 Jun 2024
Efficiently Exploring Large Language Models for Document-Level Machine Translation with In-context Learning Menglong Cui Jiangcun Du Shaolin Zhu Deyi Xiong 62 13 0 11 Jun 2024
Bridging Language Gaps in Audio-Text Retrieval Zhiyong Yan Heinrich Dinkel Yongqing Wang Jizhong Liu Junbo Zhang Yujun Wang Bin Wang VLM 80 5 0 11 Jun 2024
MaskLID: Code-Switching Language Identification through Iterative Masking Amir Hossein Kargaran François Yvon Hinrich Schütze 61 2 0 10 Jun 2024
StreamAtt: Direct Streaming Speech-to-Text Translation with Attention-based Audio History Selection Sara Papi Marco Gaido Matteo Negri L. Bentivogli 144 8 0 10 Jun 2024
Feriji: A French-Zarma Parallel Corpus, Glossary & Translator Mamadou K. Keita Elysabhete Amadou Ibrahim Habibatou Abdoulaye Alfari Christopher Homan 93 1 0 09 Jun 2024
Beyond Efficiency: Scaling AI Sustainably Carole-Jean Wu Bilge Acun Ramya Raghavendra Kim Hazelwood GNN 100 19 0 08 Jun 2024
On Subjective Uncertainty Quantification and Calibration in Natural Language Generation Ziyu Wang Chris Holmes UQLM 162 7 0 07 Jun 2024
XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model Edresson Casanova Kelly Davis Eren Golge Görkem Göknar Iulian Gulea ... Aya Aljafari Joshua Meyer Reuben Morais Samuel Olayemi Julian Weber VLM 100 84 0 07 Jun 2024
Translation Deserves Better: Analyzing Translation Artifacts in Cross-lingual Visual Question Answering Yujin Baek Koanho Lee Hyesu Lim Jaeseok Kim Junmo Park Yu-Jung Heo Du-Seong Chang Jaegul Choo 38 3 0 04 Jun 2024
Diver: Large Language Model Decoding with Span-Level Mutual Information Verification Jinliang Lu Chen Wang Jiajun Zhang 112 3 0 04 Jun 2024
LLMs Beyond English: Scaling the Multilingual Capability of LLMs with Cross-Lingual Feedback Wen Lai Mohsen Mesgar Alexander Fraser LRM ALM 121 26 0 03 Jun 2024
Outliers and Calibration Sets have Diminishing Effect on Quantization of Modern LLMs Davide Paglieri Saurabh Dash Tim Rocktaschel Jack Parker-Holder MQ 75 6 0 31 May 2024
Multilingual Text Style Transfer: Datasets & Models for Indian Languages Sourabrata Mukherjee Atul Kr. Ojha Akanksha Bansal D. Alok John P. Mccrae Ondrej Dusek VLM 57 7 0 31 May 2024
Open Ko-LLM Leaderboard: Evaluating Large Language Models in Korean with Ko-H5 Benchmark Chanjun Park Hyeonwoo Kim Dahyun Kim Seonghwan Cho Sanghoon Kim Sukyung Lee Yungi Kim Hwalsuk Lee ELM ALM 96 16 0 31 May 2024
Is In-Context Learning Sufficient for Instruction Following in LLMs? Hao Zhao Maksym Andriushchenko Francesco Croce Nicolas Flammarion 127 14 0 30 May 2024
Critical Learning Periods: Leveraging Early Training Dynamics for Efficient Data Pruning E. Chimoto Jay Gala Orevaoghene Ahia Julia Kreutzer Bruce A. Bassett Sara Hooker VLM 95 6 0 29 May 2024
MindMerger: Efficient Boosting LLM Reasoning in non-English Languages Zixian Huang Wenhao Zhu Gong Cheng Lei Li Fei Yuan LRM 93 14 0 27 May 2024
Multilingual Diversity Improves Vision-Language Representations Thao Nguyen Matthew Wallingford Sebastin Santy Wei-Chiu Ma Sewoong Oh Ludwig Schmidt Pang Wei Koh Ranjay Krishna VLM 73 6 0 27 May 2024
Low-resourced Languages and Online Knowledge Repositories: A Need-Finding Study H. Nigatu John F. Canny Sarah E. Chasins 53 2 0 26 May 2024