Title
Baldur: Whole-Proof Generation and Repair with Large Language Models E. First M. Rabe Talia Ringer Yuriy Brun 67 93 0 08 Mar 2023
The BigScience ROOTS Corpus: A 1.6TB Composite Multilingual Dataset Hugo Laurenccon Lucile Saulnier Thomas Wang Christopher Akiki Albert Villanova del Moral ... Violette Lepercq Suzana Ilić Margaret Mitchell Sasha Luccioni Yacine Jernite AI4CE AILaw 44 163 0 07 Mar 2023
OpenICL: An Open-Source Framework for In-context Learning Zhenyu Wu Yaoxiang Wang Jiacheng Ye Jiangtao Feng Jingjing Xu Yu Qiao Zhiyong Wu 26 49 0 06 Mar 2023
Prismer: A Vision-Language Model with Multi-Task Experts Shikun Liu Linxi Fan Edward Johns Zhiding Yu Chaowei Xiao Anima Anandkumar VLM MLLM 44 21 0 04 Mar 2023
Investigating the Effectiveness of Task-Agnostic Prefix Prompt for Instruction Following Seonghyeon Ye Hyeonbin Hwang Sohee Yang Hyeongu Yun Yireun Kim Minjoon Seo LRM 32 34 0 28 Feb 2023
LLaMA: Open and Efficient Foundation Language Models Hugo Touvron Thibaut Lavril Gautier Izacard Xavier Martinet Marie-Anne Lachaux ... Faisal Azhar Aurelien Rodriguez Armand Joulin Edouard Grave Guillaume Lample ALM PILM 8 12,291 0 27 Feb 2023
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks Rui-Jie Zhu Qihang Zhao Guoqi Li Jason Eshraghian BDL VLM 26 82 0 27 Feb 2023
On the Robustness of ChatGPT: An Adversarial and Out-of-distribution Perspective Jindong Wang Xixu Hu Wenxin Hou Hao Chen Runkai Zheng ... Weirong Ye Xiubo Geng Binxing Jiao Yue Zhang Xingxu Xie AI4MH 52 220 0 22 Feb 2023
In-context Example Selection with Influences Nguyen Tai Eric Wong 13 48 0 21 Feb 2023
Conversation Style Transfer using Few-Shot Learning Shamik Roy Raphael Shu Nikolaos Pappas Elman Mansimov Yi Zhang Saab Mansour Dan Roth 25 8 0 16 Feb 2023
Do We Still Need Clinical Language Models? Eric P. Lehman Evan Hernandez Diwakar Mahajan Jonas Wulff Micah J. Smith Zachary M. Ziegler Daniel Nadler Peter Szolovits Alistair E. W. Johnson Emily Alsentzer LM&MA AI4MH 24 133 0 16 Feb 2023
Transformer models: an introduction and catalog X. Amatriain Ananth Sankar Jie Bing Praveen Kumar Bodigutla Timothy J. Hazen Michaeel Kazi 24 50 0 12 Feb 2023
In-Context Learning with Many Demonstration Examples Mukai Li Shansan Gong Jiangtao Feng Yiheng Xu Jinchao Zhang Zhiyong Wu Lingpeng Kong 40 31 0 09 Feb 2023
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots Reham Omar Omij Mangukiya Panos Kalnis Essam Mansour AI4MH 24 75 0 08 Feb 2023
The Gradient of Generative AI Release: Methods and Considerations Irene Solaiman 27 98 0 05 Feb 2023
Down the Rabbit Hole: Detecting Online Extremism, Radicalisation, and Politicised Hate Speech Jarod Govers Philip G. Feldman Aaron Dant Panos Patros 17 27 0 27 Jan 2023
DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature E. Mitchell Yoonho Lee Alexander Khazatsky Christopher D. Manning Chelsea Finn 29 582 0 26 Jan 2023
Efficient Language Model Training through Cross-Lingual and Progressive Transfer Learning Malte Ostendorff Georg Rehm CLIP VLM CLL 41 23 0 23 Jan 2023
Blind Judgement: Agent-Based Supreme Court Modelling With GPT S. Hamilton LLMAG ELM 27 38 0 12 Jan 2023
Cramming: Training a Language Model on a Single GPU in One Day Jonas Geiping Tom Goldstein MoE 30 84 0 28 Dec 2022
Why Does Surprisal From Larger Transformer-Based Language Models Provide a Poorer Fit to Human Reading Times? Byung-Doh Oh William Schuler 21 101 0 23 Dec 2022
JASMINE: Arabic GPT Models for Few-Shot Learning El Moatez Billah Nagoudi Muhammad Abdul-Mageed AbdelRahim Elmadany Alcides Alcoba Inciarte Md. Tawkat Islam Khondaker 25 7 0 21 Dec 2022
Analyzing Semantic Faithfulness of Language Models via Input Intervention on Question Answering Akshay Chaturvedi Swarnadeep Bhar Soumadeep Saha Utpal Garain Nicholas Asher 33 4 0 21 Dec 2022
When Not to Trust Language Models: Investigating Effectiveness of Parametric and Non-Parametric Memories Alex Troy Mallen Akari Asai Victor Zhong Rajarshi Das Daniel Khashabi Hannaneh Hajishirzi RALM HILM KELM 40 515 0 20 Dec 2022
Is GPT-3 a Good Data Annotator? Bosheng Ding Chengwei Qin Linlin Liu Yew Ken Chia Shafiq R. Joty Boyang Albert Li Lidong Bing 24 233 0 20 Dec 2022
CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Data Limitation With Contrastive Learning Xiaoming Liu Zhaohan Zhang Yichen Wang Hang Pu Y. Lan Chao Shen 22 40 0 20 Dec 2022
CoCoMIC: Code Completion By Jointly Modeling In-file and Cross-file Context Yangruibo Ding Zijian Wang Wasi Uddin Ahmad M. K. Ramanathan Ramesh Nallapati Parminder Bhatia Dan Roth Bing Xiang 21 68 0 20 Dec 2022
Inducing Character-level Structure in Subword-based Language Models with Type-level Interchange Intervention Training Jing-ling Huang Zhengxuan Wu Kyle Mahowald Christopher Potts 24 13 0 19 Dec 2022
Z-ICL: Zero-Shot In-Context Learning with Pseudo-Demonstrations Xinxi Lyu Sewon Min Iz Beltagy Luke Zettlemoyer Hannaneh Hajishirzi VLM 17 62 0 19 Dec 2022
KNIFE: Distilling Reasoning Knowledge From Free-Text Rationales Aaron Chan Zhiyuan Zeng Wyatt Lake Brihi Joshi Hanjie Chen Xiang Ren ReLM LRM 31 1 0 19 Dec 2022
The case for 4-bit precision: k-bit Inference Scaling Laws Tim Dettmers Luke Zettlemoyer MQ 19 214 0 19 Dec 2022
BLOOM+1: Adding Language Support to BLOOM for Zero-Shot Prompting Zheng-Xin Yong Hailey Schoelkopf Niklas Muennighoff Alham Fikri Aji David Ifeoluwa Adelani ... Genta Indra Winata Stella Biderman Edward Raff Dragomir R. Radev Vassilina Nikoulina CLL VLM AI4CE LRM 35 81 0 19 Dec 2022
Large Language Models Meet NL2Code: A Survey Daoguang Zan B. Chen Fengji Zhang Di Lu Bingchao Wu Bei Guan Yongji Wang Jian-Guang Lou ELM ALM 31 170 0 19 Dec 2022
Rethinking the Role of Scale for In-Context Learning: An Interpretability-based Case Study at 66 Billion Scale Hritik Bansal Karthik Gopalakrishnan Saket Dingliwal S. Bodapati Katrin Kirchhoff Dan Roth LRM 22 48 0 18 Dec 2022
Synthesis and Evaluation of a Domain-specific Large Data Set for Dungeons & Dragons Akila Peiris Nisansa de Silva 27 5 0 18 Dec 2022
Self-Prompting Large Language Models for Zero-Shot Open-Domain QA Junlong Li Jinyuan Wang Zhuosheng Zhang Hai Zhao LRM 31 32 0 16 Dec 2022
Implicit causality in GPT-2: a case study H. Huynh T. Lentz Emiel van Miltenburg LRM 27 3 0 08 Dec 2022
Legal Prompt Engineering for Multilingual Legal Judgement Prediction Dietrich Trautmann Alina Petrova Frank Schilder ELM AILaw 33 74 0 05 Dec 2022
Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of Foundation Models Peter Henderson E. Mitchell Christopher D. Manning Dan Jurafsky Chelsea Finn 23 47 0 27 Nov 2022
Understanding BLOOM: An empirical study on diverse NLP tasks Parag Dakle Sai Krishna Rallabandi Preethi Raghavan AI4CE 36 3 0 27 Nov 2022
DS-1000: A Natural and Reliable Benchmark for Data Science Code Generation Yuhang Lai Chengxi Li Yiming Wang Tianyi Zhang Ruiqi Zhong Luke Zettlemoyer Scott Yih Daniel Fried Si-yi Wang Tao Yu ELM ALM 27 309 0 18 Nov 2022
Galactica: A Large Language Model for Science Ross Taylor Marcin Kardas Guillem Cucurull Thomas Scialom Anthony Hartshorn Elvis Saravia Andrew Poulton Viktor Kerkez Robert Stojnic ELM ReLM 34 727 0 16 Nov 2022
Evaluating the Factual Consistency of Large Language Models Through News Summarization Derek Tam Anisha Mascarenhas Shiyue Zhang Sarah Kwan Joey Tianyi Zhou Colin Raffel HILM 25 96 0 15 Nov 2022
Large Language Models Struggle to Learn Long-Tail Knowledge Nikhil Kandpal H. Deng Adam Roberts Eric Wallace Colin Raffel RALM KELM 41 382 0 15 Nov 2022
An FNet based Auto Encoder for Long Sequence News Story Generation Paul K. Mandal Rakeshkumar V. Mahto 21 0 0 15 Nov 2022
Prompting Language Models for Linguistic Structure Terra Blevins Hila Gonen Luke Zettlemoyer LRM 35 40 0 15 Nov 2022
Logical Tasks for Measuring Extrapolation and Rule Comprehension Ippei Fujisawa Ryota Kanai ELM LRM 28 4 0 14 Nov 2022
Debiasing Methods for Fairer Neural Models in Vision and Language Research: A Survey Otávio Parraga Martin D. Móre C. M. Oliveira Nathan Gavenski L. S. Kupssinskü Adilson Medronha L. V. Moura Gabriel S. Simões Rodrigo C. Barros 42 11 0 10 Nov 2022
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model BigScience Workshop : Teven Le Scao Angela Fan Christopher Akiki ... Zhongli Xie Zifan Ye M. Bras Younes Belkada Thomas Wolf VLM 116 2,310 0 09 Nov 2022
nBIIG: A Neural BI Insights Generation System for Table Reporting Yotam Perlitz D. Sheinwald Noam Slonim Michal Shmueli-Scheuer 15 2 0 08 Nov 2022