mT5: A massively multilingual pre-trained text-to-text transformer

22 October 2020

Papers citing "mT5: A massively multilingual pre-trained text-to-text transformer"

50 / 468 papers shown

Title
Aquarius: A Family of Industry-Level Video Generation Models for Marketing Scenarios Huafeng Shi Jianzhong Liang Rongchang Xie Xian Wu Cheng Chen Chang Liu VGen 22 0 0 14 May 2025
Lost in Transliteration: Bridging the Script Gap in Neural IR Andreas Chari Iadh Ounis Sean MacAvaney 24 0 0 13 May 2025
Token-free Models for Sarcasm Detection Sumit Mamtani Maitreya Sonawane Kanika Agarwal Nishanth Sanjeev 48 0 0 02 May 2025
Robust Misinformation Detection by Visiting Potential Commonsense Conflict Bing Wang Ximing Li C. Li Bingrui Zhao Bo Fu Renchu Guan Shengsheng Wang 53 0 0 30 Apr 2025
Enhancing Non-Core Language Instruction-Following in Speech LLMs via Semi-Implicit Cross-Lingual CoT Reasoning Hongfei Xue Yufeng Tang Hexin Liu Jun Zhang Xuelong Geng Lei Xie LRM 57 0 0 29 Apr 2025
RepText: Rendering Visual Text via Replicating Haozhao Wang Yongjun Xu Yong Li Jiajun Li Chaowei Zhang Jingchao Wang Kejia Yang Z. Chen VLM 66 0 0 28 Apr 2025
Trillion 7B Technical Report Sungjun Han Juyoung Suk Suyeong An Hyungguk Kim Kyuseok Kim Wonsuk Yang Seungtaek Choi Jamin Shin 146 1 0 21 Apr 2025
NNN: Next-Generation Neural Networks for Marketing Mix Modeling Thomas Mulc Mike Anderson Paul Cubre Huikun Zhang Ivy Liu Saket Kumar 164 0 0 08 Apr 2025
Regional Tiny Stories: Using Small Models to Compare Language Learning and Tokenizer Performance Nirvan Patil Malhar Abhay Inamdar Agnivo Gosai Guruprasad Pathak Anish Joshi Aryan Sagavekar Anish Joshirao Raj Abhijit Dandekar Rajat Dandekar Sreedath Panat 46 0 0 07 Apr 2025
Language Models at the Syntax-Semantics Interface: A Case Study of the Long-Distance Binding of Chinese Reflexive ziji Xiulin Yang 40 0 0 02 Apr 2025
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations Mahjabin Nahar Eun-Ju Lee Jin Won Park Dongwon Lee HILM 75 0 0 01 Apr 2025
The Challenge of Achieving Attributability in Multilingual Table-to-Text Generation with Question-Answer Blueprints Aden Haussmann LMTD 62 0 0 29 Mar 2025
PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment Jong Myoung Kim Young-Jun_Lee Ho-Jin Choi Sangkeun Jung 63 0 0 24 Mar 2025
LANGALIGN: Enhancing Non-English Language Models via Cross-Lingual Embedding Alignment Jong Myoung Kim Young-Jun Lee Ho-Jin Choi Sangkeun Jung 40 0 0 24 Mar 2025
Uncertainty Distillation: Teaching Language Models to Express Semantic Confidence Sophia Hager David Mueller Kevin Duh Nicholas Andrews 69 0 0 18 Mar 2025
LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama Naome A. Etori Kevin Lu Randu Karisa Arturs Kanepajs LRM ELM 190 0 0 14 Mar 2025
A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization Nevidu Jayatilleke Ruvan Weerasinghe AILaw 82 0 0 13 Mar 2025
Beyond Decoder-only: Large Language Models Can be Good Encoders for Machine Translation Yingfeng Luo Tong Zheng Yongyu Mu Yangqiu Song Qinghong Zhang ... Ziqiang Xu Peinan Feng Xiaoqian Liu Tong Xiao Jingbo Zhu AI4CE 203 0 0 09 Mar 2025
In-context Learning vs. Instruction Tuning: The Case of Small and Multilingual Language Models David Ponce Thierry Etchegoyhen 74 1 0 03 Mar 2025
Plan2Align: Predictive Planning Based Test-Time Preference Alignment in Paragraph-Level Machine Translation Kuang-Da Wang Teng-Ruei Chen Yu-Heng Hung Shuoyang Ding Yueh-Hua Wu Yu-Chun Wang Chao-Han Huck Yang Wen-Chih Peng Ping-Chun Hsieh 74 0 0 28 Feb 2025
HuAMR: A Hungarian AMR Parser and Dataset Botond Barta Endre Hamerlik Milán Konor Nyist Judit Ács 41 0 0 27 Feb 2025
Language Models' Factuality Depends on the Language of Inquiry Tushar Aggarwal Kumar Tanmay Ayush Agrawal Kumar Ayush Hamid Palangi Paul Pu Liang HILM KELM 71 0 0 25 Feb 2025
Do Multilingual LLMs Think In English? Lisa Schut Y. Gal Sebastian Farquhar 44 3 0 24 Feb 2025
Encryption-Friendly LLM Architecture Donghwan Rho Taeseong Kim Minje Park Jung Woo Kim Hyunsik Chae Jung Hee Cheon Ernest K. Ryu 57 2 0 24 Feb 2025
Multilingual Language Model Pretraining using Machine-translated Data Jiayi Wang Yao Lu Maurice Weber Max Ryabinin David Ifeoluwa Adelani Yihong Chen Raphael Tang Pontus Stenetorp LRM 83 2 0 20 Feb 2025
Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation Vera Neplenbroek Arianna Bisazza Raquel Fernández 107 0 0 17 Feb 2025
M-ABSA: A Multilingual Dataset for Aspect-Based Sentiment Analysis Chengyan Wu Bolei Ma Yong-Jin Liu Zheyu Zhang Ningyuan Deng Yong Li Baolan Chen Yi Zhang Barbara Plank Yun Xue 49 0 0 17 Feb 2025
ALGEN: Few-shot Inversion Attacks on Textual Embeddings using Alignment and Generation Yiyi Chen Qiongkai Xu Johannes Bjerva 49 0 0 16 Feb 2025
A Large-Scale Benchmark for Vietnamese Sentence Paraphrases Sang Quang Nguyen Kiet Van Nguyen 62 0 0 11 Feb 2025
Efficient-vDiT: Efficient Video Diffusion Transformers With Attention Tile Hangliang Ding Dacheng Li Runlong Su Peiyuan Zhang Zhijie Deng Ion Stoica Hao Zhang VGen 73 4 0 10 Feb 2025
Multilingual State Space Models for Structured Question Answering in Indic Languages A. Vats Rahul Raja Mrinal Mathur Vinija Jain Aman Chadha 70 1 0 01 Feb 2025
A linguistically-motivated evaluation methodology for unraveling model's abilities in reading comprehension tasks Elie Antoine Frédéric Béchet Géraldine Damnati Philippe Langlais 56 1 0 29 Jan 2025
Data Duplication: A Novel Multi-Purpose Attack Paradigm in Machine Unlearning Dayong Ye Tainqing Zhu Jiashi Li Kun Gao B. Liu Lefei Zhang Wanlei Zhou Yanmei Zhang AAML MU 80 0 0 28 Jan 2025
News Without Borders: Domain Adaptation of Multilingual Sentence Embeddings for Cross-lingual News Recommendation Andreea Iana Fabian David Schmidt Goran Glavas Heiko Paulheim 71 3 0 20 Jan 2025
Can MLLMs Generalize to Multi-Party dialog? Exploring Multilingual Response Generation in Complex Scenarios Zhongtian Hu Yiwen Cui Ronghan Li Meng Zhao Lifang Wang 41 0 0 20 Jan 2025
Large Language Models Share Representations of Latent Grammatical Concepts Across Typologically Diverse Languages Jannik Brinkmann Chris Wendler Christian Bartelt Aaron Mueller 51 9 0 10 Jan 2025
CLIX: Cross-Lingual Explanations of Idiomatic Expressions Aaron Gluck Katharina von der Wense Maria Pacheco 38 0 0 06 Jan 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Joey Tianyi Zhou Parisa Kordjamshidi LRM 63 19 0 31 Dec 2024
AfriHG: News headline generation for African Languages Toyib Ogunremi Serah Akojenu Anthony Soronnadi Olubayo Adekanmbi David Ifeoluwa Adelani 58 1 0 31 Dec 2024
Enabling Low-Resource Language Retrieval: Establishing Baselines for Urdu MS MARCO Umer Butt Stalin Veranasi Günter Neumann 79 0 0 17 Dec 2024
RoundTripOCR: A Data Generation Technique for Enhancing Post-OCR Error Correction in Low-Resource Devanagari Languages Harshvivek Kashid Pushpak Bhattacharyya 87 1 0 14 Dec 2024
Training Bilingual LMs with Data Constraints in the Targeted Language Skyler Seto Maartje ter Hoeve He Bai Natalie Schluter David Grangier 86 0 0 20 Nov 2024
Heuristic-Free Multi-Teacher Learning Huy Thong Nguyen En-Hung Chu Lenord Melvix Jazon Jiao Chunglin Wen Benjamin Louie 77 0 0 19 Nov 2024
The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities Zhaofeng Wu Xinyan Velocity Yu Dani Yogatama Jiasen Lu Yoon Kim AIFin 54 10 0 07 Nov 2024
GlotCC: An Open Broad-Coverage CommonCrawl Corpus and Pipeline for Minority Languages Amir Hossein Kargaran François Yvon Hinrich Schutze VLM 38 5 0 31 Oct 2024
MrT5: Dynamic Token Merging for Efficient Byte-level Language Models Julie Kallini Shikhar Murty Christopher D. Manning Christopher Potts Róbert Csordás 40 2 0 28 Oct 2024
Think Carefully and Check Again! Meta-Generation Unlocking LLMs for Low-Resource Cross-Lingual Summarization Zhecheng Li Yijiao Wang Bryan Hooi Yujun Cai Naifan Cheung Nanyun Peng Kai-Wei Chang 44 1 0 26 Oct 2024
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Contrastive Framework Hengyuan Zhang Chenming Shang Sizhe Wang Dongdong Zhang Feng Yao Renliang Sun Yiyao Yu Yujiu Yang Furu Wei 62 3 0 25 Oct 2024
Cross-lingual Transfer of Reward Models in Multilingual Alignment Jiwoo Hong Noah Lee Rodrigo Martínez-Castaño César Rodríguez James Thorne 48 4 0 23 Oct 2024
Grammatical Error Correction for Low-Resource Languages: The Case of Zarma Mamadou K. Keita Christopher Homan Sofiane Abdoulaye Hamani Adwoa Bremang Marcos Zampieri Habibatou Abdoulaye Alfari Elysabhete Amadou Ibrahim 33 0 0 20 Oct 2024