LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama

LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama

14 March 2025

Arturs Kanepajs

Papers citing "LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama"

15 / 15 papers shown

Title
RideKE: Leveraging Low-Resource, User-Generated Twitter Content for Sentiment and Emotion Detection in Kenyan Code-Switched Dataset Naome A. Etori Maria Gini 127 2 0 10 Feb 2025
Adding Error Bars to Evals: A Statistical Approach to Language Model Evaluations Evan Miller ELM 48 22 0 01 Nov 2024
IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models David Ifeoluwa Adelani Jessica Ojo Israel Abebe Azime Jian Yun Zhuang Jesujoba Oluwadara Alabi ... Salomey Osei Sokhar Samb Tadesse Kebede Guge Pontus Stenetorp Pontus Stenetorp ELM 103 9 0 05 Jun 2024
Khayyam Challenge (PersianMMLU): Is Your LLM Truly Wise to The Persian Language? Omid Ghahroodi Marzia Nouri Mohammad V. Sanian Alireza Sahebi D. Dastgheib Ehsaneddin Asgari M. Baghshah M. Rohban ELM AAML 54 11 0 09 Apr 2024
CMMLU: Measuring massive multitask language understanding in Chinese Haonan Li Yixuan Zhang Fajri Koto Yifei Yang Hai Zhao Yeyun Gong Nan Duan Tim Baldwin ALM ELM 64 253 0 15 Jun 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 658 13,788 0 15 Mar 2023
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model BigScience Workshop : Teven Le Scao Angela Fan Christopher Akiki ... Zhongli Xie Zifan Ye M. Bras Younes Belkada Thomas Wolf VLM 280 2,364 0 09 Nov 2022
No Language Left Behind: Scaling Human-Centered Machine Translation Nllb team Marta R. Costa-jussá James Cross Onur cCelebi Maha Elbayad ... Alexandre Mourachko C. Ropers Safiyyah Saleem Holger Schwenk Jeff Wang MoE 136 1,220 0 11 Jul 2022
A Survey on Recent Approaches for Natural Language Processing in Low-Resource Scenarios Michael A. Hedderich Lukas Lange Heike Adel Jannik Strötgen Dietrich Klakow 275 292 0 23 Oct 2020
The Tatoeba Translation Challenge -- Realistic Data Sets for Low Resource and Multilingual MT Jörg Tiedemann 189 165 0 13 Oct 2020
Low-resource Languages: A Review of Past Work and Future Challenges Alexandre Magueresse Vincent Carles Evan Heetderks 51 172 0 12 Jun 2020
XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization Junjie Hu Sebastian Ruder Aditya Siddhant Graham Neubig Orhan Firat Melvin Johnson ELM 142 966 0 24 Mar 2020
Unsupervised Cross-lingual Representation Learning at Scale Alexis Conneau Kartikay Khandelwal Naman Goyal Vishrav Chaudhary Guillaume Wenzek Francisco Guzmán Edouard Grave Myle Ott Luke Zettlemoyer Veselin Stoyanov 162 6,496 0 05 Nov 2019
SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems Alex Jinpeng Wang Yada Pruksachatkun Nikita Nangia Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 185 2,296 0 02 May 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 1.0K 93,936 0 11 Oct 2018