mT5: A massively multilingual pre-trained text-to-text transformer

22 October 2020

Papers citing "mT5: A massively multilingual pre-trained text-to-text transformer"

50 / 469 papers shown

Title
IndicXNLI: Evaluating Multilingual Inference for Indian Languages Divyanshu Aggarwal V. Gupta Anoop Kunchukuttan 31 27 0 19 Apr 2022
WordAlchemy: A transformer-based Reverse Dictionary S. Mane Harshali B. Patil Kanhaiya Madaswar Pranav Sadavarte 16 5 0 16 Apr 2022
Super-NaturalInstructions: Generalization via Declarative Instructions on 1600+ NLP Tasks Yizhong Wang Swaroop Mishra Pegah Alipoormolabashi Yeganeh Kordi Amirreza Mirzaei ... Chitta Baral Yejin Choi Noah A. Smith Hannaneh Hajishirzi Daniel Khashabi ELM 59 790 0 16 Apr 2022
mGPT: Few-Shot Learners Go Multilingual Oleh Shliazhko Alena Fenogenova Maria Tikhonova Vladislav Mikhailov Anastasia Kozlova Tatiana Shavrina 49 149 0 15 Apr 2022
GPT-NeoX-20B: An Open-Source Autoregressive Language Model Sid Black Stella Biderman Eric Hallahan Quentin G. Anthony Leo Gao ... Shivanshu Purohit Laria Reynolds J. Tow Benqi Wang Samuel Weinbach 99 802 0 14 Apr 2022
MMTAfrica: Multilingual Machine Translation for African Languages Chris C. Emezue Bonaventure F. P. Dossou 27 24 0 08 Apr 2022
ByT5 model for massively multilingual grapheme-to-phoneme conversion Jian Zhu Cong Zhang David Jurgens 19 36 0 06 Apr 2022
Global Readiness of Language Technology for Healthcare: What would it Take to Combat the Next Pandemic? Ishani Mondal Kabir Ahuja Mohit Jain Jacki O Neil Kalika Bali Monojit Choudhury ELM LM&MA 29 4 0 06 Apr 2022
One Country, 700+ Languages: NLP Challenges for Underrepresented Languages and Dialects in Indonesia Alham Fikri Aji Genta Indra Winata Fajri Koto Samuel Cahyawijaya Ade Romadhony ... David Moeljadi Radityo Eko Prasojo Timothy Baldwin Jey Han Lau Sebastian Ruder 40 100 0 24 Mar 2022
Leveraging unsupervised and weakly-supervised data to improve direct speech-to-speech translation Ye Jia Yifan Ding Ankur Bapna Colin Cherry Yu Zhang Alexis Conneau Nobuyuki Morioka 47 20 0 24 Mar 2022
Ensembling and Knowledge Distilling of Large Sequence Taggers for Grammatical Error Correction M. Tarnavskyi Artem Chernodub Kostiantyn Omelianchuk 3DV 25 24 0 24 Mar 2022
Probing for Labeled Dependency Trees Max Müller-Eberstein Rob van der Goot Barbara Plank 19 7 0 24 Mar 2022
AraBART: a Pretrained Arabic Sequence-to-Sequence Model for Abstractive Summarization Moussa Kamal Eddine Nadi Tomeh Nizar Habash Joseph Le Roux Michalis Vazirgiannis 30 44 0 21 Mar 2022
Match the Script, Adapt if Multilingual: Analyzing the Effect of Multilingual Pretraining on Cross-lingual Transferability Yoshinari Fujinuma Jordan L. Boyd-Graber Katharina Kann AAML 62 23 0 21 Mar 2022
Pretraining with Artificial Language: Studying Transferable Knowledge in Language Models Ryokan Ri Yoshimasa Tsuruoka 32 25 0 19 Mar 2022
$Meta-X$_{NLG}$: A Meta-Learning Approach Based on Language Clustering for Zero-Shot Cross-Lingual Transfer and Generation$ Meta-X $_{NLG}$ : A Meta-Learning Approach Based on Language Clustering for Zero-Shot Cross-Lingual Transfer and Generation Kaushal Kumar Maurya M. Desarkar 23 8 0 19 Mar 2022
Challenges and Strategies in Cross-Cultural NLP Daniel Hershcovich Stella Frank Heather Lent Miryam de Lhoneux Mostafa Abdou ... Ruixiang Cui Constanza Fierro Katerina Margatina Phillip Rust Anders Søgaard 43 164 0 18 Mar 2022
Coloring the Blank Slate: Pre-training Imparts a Hierarchical Inductive Bias to Sequence-to-sequence Models Aaron Mueller Robert Frank Tal Linzen Luheng Wang Sebastian Schuster AIMat 19 33 0 17 Mar 2022
Pre-Trained Multilingual Sequence-to-Sequence Models: A Hope for Low-Resource Language Translation? E. Lee Sarubi Thillainathan Shravan Nayak Surangika Ranathunga David Ifeoluwa Adelani Ruisi Su Arya D. McCarthy VLM 21 43 0 16 Mar 2022
MCoNaLa: A Benchmark for Code Generation from Multiple Natural Languages Zhiruo Wang Grace Cuenca Shuyan Zhou Frank F. Xu Graham Neubig 29 50 0 16 Mar 2022
Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction Kuan-Hao Huang I-Hung Hsu Premkumar Natarajan Kai-Wei Chang Nanyun Peng 41 65 0 15 Mar 2022
Does Corpus Quality Really Matter for Low-Resource Languages? Mikel Artetxe Itziar Aldabe Rodrigo Agerri Olatz Perez-de-Viñaspre Aitor Soroa Etxabe 49 19 0 15 Mar 2022
ViWOZ: A Multi-Domain Task-Oriented Dialogue Systems Dataset For Low-resource Language Phi Nguyen Van Tung Cao Hoang Dũng Nguyễn Mạnh Q. Minh Long Tran Quoc 32 2 0 15 Mar 2022
IndicNLG Benchmark: Multilingual Datasets for Diverse NLG Tasks in Indic Languages Aman Kumar Himani Shrotriya P. Sahu Raj Dabre Ratish Puduppully Anoop Kunchukuttan Amogh Mishra Mitesh M. Khapra Pratyush Kumar 46 38 0 10 Mar 2022
IT5: Text-to-text Pretraining for Italian Language Understanding and Generation Gabriele Sarti Malvina Nissim AILaw 18 42 0 07 Mar 2022
Mukayese: Turkish NLP Strikes Back Ali Safaya Emirhan Kurtulucs Arda Goktougan Deniz Yuret 28 22 0 02 Mar 2022
SemSup: Semantic Supervision for Simple and Scalable Zero-shot Generalization Austin W. Hanjie Ameet Deshpande Karthik R. Narasimhan VLM 36 2 0 26 Feb 2022
Morphology Without Borders: Clause-Level Morphology Omer Goldman Reut Tsarfaty AILaw 44 3 0 25 Feb 2022
Using natural language prompts for machine translation Xavier Garcia Orhan Firat AI4CE 25 30 0 23 Feb 2022
A New Generation of Perspective API: Efficient Multilingual Character-level Transformers Alyssa Lees Vinh Q. Tran Yi Tay Jeffrey Scott Sorensen Jai Gupta Donald Metzler Lucy Vasserman 39 175 0 22 Feb 2022
CALCS 2021 Shared Task: Machine Translation for Code-Switched Data Shuguang Chen Gustavo Aguilar A. Srinivasan Mona T. Diab Thamar Solorio 42 15 0 19 Feb 2022
ST-MoE: Designing Stable and Transferable Sparse Expert Models Barret Zoph Irwan Bello Sameer Kumar Nan Du Yanping Huang J. Dean Noam M. Shazeer W. Fedus MoE 24 182 0 17 Feb 2022
Integrating question answering and text-to-SQL in Portuguese M. M. José M. A. José Denis Deratani Mauá Fabio Gagliardi Cozman LMTD 17 4 0 08 Feb 2022
Cedille: A large autoregressive French language model Martin Müller Florian Laurent 36 19 0 07 Feb 2022
mSLAM: Massively multilingual joint pre-training for speech and text Ankur Bapna Colin Cherry Yu Zhang Ye Jia Melvin Johnson Yong Cheng Simran Khanuja Jason Riesa Alexis Conneau VLM 30 111 0 03 Feb 2022
XAlign: Cross-lingual Fact-to-Text Alignment and Generation for Low-Resource Languages Tushar Abhishek Shivprasad Sagare Bhavyajeet Singh Anubhav Sharma Manish Gupta Vasudeva Varma 22 9 0 01 Feb 2022
Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation Olga Majewska E. Razumovskaia Edoardo Ponti Ivan Vulić Anna Korhonen 32 28 0 31 Jan 2022
Correcting diacritics and typos with a ByT5 transformer model Lukas Stankevicius M. Lukoševičius J. Kapočiūtė-Dzikienė Monika Briediene Tomas Krilavičius 28 20 0 31 Jan 2022
Towards a Cleaner Document-Oriented Multilingual Crawled Corpus Julien Abadji Pedro Ortiz Suarez Laurent Romary Benoît Sagot CLL 39 153 0 17 Jan 2022
A Warm Start and a Clean Crawled Corpus -- A Recipe for Good Language Models Vésteinn Snæbjarnarson Haukur Barri Símonarson Pétur Orri Ragnarsson Svanhvít Lilja Ingólfsdóttir H. Jónsson Vilhjálmur Þorsteinsson H. Einarsson 24 26 0 14 Jan 2022
Few-shot Learning with Multilingual Language Models Xi Lin Todor Mihaylov Mikel Artetxe Tianlu Wang Shuohui Chen ... Luke Zettlemoyer Zornitsa Kozareva Mona T. Diab Ves Stoyanov Xian Li BDL ELM LRM 64 285 0 20 Dec 2021
Large Dual Encoders Are Generalizable Retrievers Jianmo Ni Chen Qu Jing Lu Zhuyun Dai Gustavo Hernández Ábrego ... Vincent Zhao Yi Luan Keith B. Hall Ming-Wei Chang Yinfei Yang DML 33 434 0 15 Dec 2021
WECHSEL: Effective initialization of subword embeddings for cross-lingual transfer of monolingual language models Benjamin Minixhofer Fabian Paischer Navid Rekabsaz 24 74 0 13 Dec 2021
Dependency Learning for Legal Judgment Prediction with a Unified Text-to-Text Transformer Yunyun Huang Xiaoyu Shen Chuanyi Li Jidong Ge B. Luo AILaw 27 19 0 13 Dec 2021
Zero-Shot Cross-Lingual Machine Reading Comprehension via Inter-sentence Dependency Graph Liyan Xu Xuchao Zhang Bo Zong Yanchi Liu Wei Cheng Jingchao Ni Haifeng Chen Liang Zhao Jinho Choi 42 4 0 01 Dec 2021
NER-BERT: A Pre-trained Model for Low-Resource Entity Tagging Zihan Liu Feijun Jiang Yuxiang Hu Chen Shi Pascale Fung 22 37 0 01 Dec 2021
Less is More: Generating Grounded Navigation Instructions from Landmarks Su Wang Ceslee Montgomery Jordi Orbay Vighnesh Birodkar Aleksandra Faust Izzeddin Gur Natasha Jaques Austin Waters Jason Baldridge Peter Anderson 20 63 0 25 Nov 2021
Knowledge Enhanced Sports Game Summarization Jiaan Wang Zhixu Li Tingyi Zhang Duo Zheng Jianfeng Qu An Liu Lei Zhao Zhigang Chen AI4TS 28 12 0 24 Nov 2021
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing Pengcheng He Jianfeng Gao Weizhu Chen 44 1,120 0 18 Nov 2021
XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale Arun Babu Changhan Wang Andros Tjandra Kushal Lakhotia Qiantong Xu ... Yatharth Saraf J. Pino Alexei Baevski Alexis Conneau Michael Auli SSL 32 657 0 17 Nov 2021