Title
LegalBench: Prototyping a Collaborative Benchmark for Legal Reasoning Neel Guha Daniel E. Ho Julian Nyarko Christopher Ré AILaw ELM 173 17 0 13 Sep 2022
FP8 Formats for Deep Learning Paulius Micikevicius Dusan Stosic N. Burgess Marius Cornea Pradeep Dubey ... Naveen Mellempudi S. Oberman Mohammad Shoeybi Michael Siu Hao Wu BDL VLM MQ 158 141 0 12 Sep 2022
Simple and Effective Gradient-Based Tuning of Sequence-to-Sequence Models Jared Lichtarge Chris Alberti Shankar Kumar 88 4 0 10 Sep 2022
AudioLM: a Language Modeling Approach to Audio Generation Zalan Borsos Raphaël Marinier Damien Vincent Eugene Kharitonov Olivier Pietquin ... Dominik Roblek O. Teboul David Grangier Marco Tagliasacchi Neil Zeghidour AuLLM 198 617 0 07 Sep 2022
The Ethical Need for Watermarks in Machine-Generated Language A. Grinbaum Laurynas Adomaitis WaLM 52 34 0 07 Sep 2022
A Review of Sparse Expert Models in Deep Learning W. Fedus J. Dean Barret Zoph MoE 129 155 0 04 Sep 2022
IMG2IMU: Translating Knowledge from Large-Scale Images to IMU Sensing Applications Hyungjun Yoon Hyeong-Tae Cha Hoang C. Nguyen Taesik Gong Sungyeop Lee VLM SSL 116 1 0 02 Sep 2022
FOLIO: Natural Language Reasoning with First-Order Logic Simeng Han Hailey Schoelkopf Yilun Zhao Zhenting Qi Martin Riddell ... Yingbo Zhou Caiming Xiong Rex Ying Arman Cohan Dragomir R. Radev ReLM LRM 148 109 0 02 Sep 2022
Diffusion Models: A Comprehensive Survey of Methods and Applications Ling Yang Zhilong Zhang Yingxia Shao Shenda Hong Runsheng Xu Yue Zhao Wentao Zhang Tengjiao Wang Ming-Hsuan Yang DiffM MedIm 560 1,428 0 02 Sep 2022
In conversation with Artificial Intelligence: aligning language models with human values Atoosa Kasirzadeh Iason Gabriel 128 105 0 01 Sep 2022
Efficient Methods for Natural Language Processing: A Survey Marcos Vinícius Treviso Ji-Ung Lee Tianchu Ji Betty van Aken Qingqing Cao ... Emma Strubell Niranjan Balasubramanian Leon Derczynski Iryna Gurevych Roy Schwartz 163 114 0 31 Aug 2022
Negative Human Rights as a Basis for Long-term AI Safety and Regulation Ondrej Bajgar Jan Horenovsky FaML 78 9 0 31 Aug 2022
Towards Boosting the Open-Domain Chatbot with Human Feedback Hua Lu Siqi Bao H. He Fan Wang Hua Wu Haifeng Wang ALM 69 19 0 30 Aug 2022
The Alignment Problem from a Deep Learning Perspective Richard Ngo Lawrence Chan Sören Mindermann 147 193 0 30 Aug 2022
What Do NLP Researchers Believe? Results of the NLP Community Metasurvey Julian Michael Ari Holtzman Alicia Parrish Aaron Mueller Alex Jinpeng Wang ... Divyam Madaan Nikita Nangia Richard Yuanzhe Pang Jason Phang Sam Bowman 71 39 0 26 Aug 2022
PEER: A Collaborative Language Model Timo Schick Jane Dwivedi-Yu Zhengbao Jiang Fabio Petroni Patrick Lewis Gautier Izacard Qingfei You Christoforos Nalmpantis Edouard Grave Sebastian Riedel ALM 108 97 0 24 Aug 2022
Z-Code++: A Pre-trained Language Model Optimized for Abstractive Summarization Pengcheng He Baolin Peng Liyang Lu Song Wang Jie Mei ... Chenguang Zhu Wayne Xiong Michael Zeng Jianfeng Gao Xuedong Huang 119 47 0 21 Aug 2022
Using Large Language Models to Simulate Multiple Humans and Replicate Human Subject Studies Gati Aher RosaI. Arriaga Adam Tauman Kalai 209 405 0 18 Aug 2022
HELP ME THINK: A Simple Prompting Strategy for Non-experts to Create Customized Content with Models Swaroop Mishra E. Nouri LRM 125 27 0 17 Aug 2022
MultiPL-E: A Scalable and Extensible Approach to Benchmarking Neural Code Generation Federico Cassano John Gouwar Daniel Nguyen S. Nguyen Luna Phipps-Costin ... Carolyn Jane Anderson Molly Q. Feldman Arjun Guha Michael Greenberg Abhinav Jangda ELM 143 94 0 17 Aug 2022
What Artificial Neural Networks Can Tell Us About Human Language Acquisition Alex Warstadt Samuel R. Bowman 91 120 0 17 Aug 2022
Z-BERT-A: a zero-shot Pipeline for Unknown Intent detection Daniele Comi Dimitrios Christofidellis Pier Francesco Piazza Matteo Manica 109 4 0 15 Aug 2022
Interactive Code Generation via Test-Driven User-Intent Formalization Shuvendu K. Lahiri Sarah Fakhoury Aaditya Naik Georgios Sakkas Saikat Chakraborty ... Piali Choudhury Curtis von Veh J. Inala Chenglong Wang Jianfeng Gao 95 64 0 11 Aug 2022
Domain-Specific Text Generation for Machine Translation Yasmin Moslem Rejwanul Haque John D. Kelleher Andy Way 70 18 0 11 Aug 2022
Reducing Retraining by Recycling Parameter-Efficient Prompts Brian Lester Joshua Yurtsever Siamak Shakeri Noah Constant 68 12 0 10 Aug 2022
Quality Not Quantity: On the Interaction between Dataset Design and Robustness of CLIP Thao Nguyen Gabriel Ilharco Mitchell Wortsman Sewoong Oh Ludwig Schmidt CLIP VLM 184 108 0 10 Aug 2022
Limitations of Language Models in Arithmetic and Symbolic Induction Jingu Qian Hong Wang Zekun Li Shiyang Li Xifeng Yan ReLM LRM 139 76 0 09 Aug 2022
Training Overparametrized Neural Networks in Sublinear Time Yichuan Deng Han Hu Zhao Song Omri Weinstein Danyang Zhuo BDL 103 28 0 09 Aug 2022
Learning to Improve Code Efficiency Bing Chen Daniel Tarlow Kevin Swersky Martin Maas P. Heiber Ashish Naik Milad Hashemi Parthasarathy Ranganathan 85 9 0 09 Aug 2022
Investigating Efficiently Extending Transformers for Long Input Summarization Jason Phang Yao-Min Zhao Peter J. Liu RALM LLMAG 85 63 0 08 Aug 2022
Analog Bits: Generating Discrete Data using Diffusion Models with Self-Conditioning Ting-Li Chen Ruixiang Zhang Geoffrey E. Hinton DiffM 151 313 0 08 Aug 2022
Abstractive Meeting Summarization: A Survey Virgile Rennard Guokan Shang Julie Hunter Michalis Vazirgiannis 101 16 0 08 Aug 2022
Prompt Tuning for Generative Multimodal Pretrained Models Han Yang Junyang Lin An Yang Peng Wang Chang Zhou Hongxia Yang VLM LRM VPVLM 86 31 0 04 Aug 2022
GPPF: A General Perception Pre-training Framework via Sparsely Activated Multi-Task Learning Benyuan Sun Jinqiao Dai Zihao Liang Cong Liu Yi Yang Bo Bai MoE 82 4 0 03 Aug 2022
AlexaTM 20B: Few-Shot Learning Using a Large-Scale Multilingual Seq2Seq Model Saleh Soltan Shankar Ananthakrishnan Jack G. M. FitzGerald Rahul Gupta Wael Hamza ... Mukund Sridhar Fabian Triefenbach Apurv Verma Gokhan Tur Premkumar Natarajan 135 83 0 02 Aug 2022
giMLPs: Gate with Inhibition Mechanism in MLPs Cheng Kang Jindich Prokop Lei Tong Huiyu Zhou Yong Hu Daneil Novak 45 0 0 01 Aug 2022
Language Models Can Teach Themselves to Program Better Patrick M. Haluptzok Matthew Bowers Adam Tauman Kalai ReLM SyDa LRM 134 82 0 29 Jul 2022
LAD: Language Models as Data for Zero-Shot Dialog Shikib Mehri Yasemin Altun M. Eskénazi 72 26 0 28 Jul 2022
Large Language Models and the Reverse Turing Test T. Sejnowski ELM 168 114 0 28 Jul 2022
Efficient Training of Language Models to Fill in the Middle Mohammad Bavarian Heewoo Jun Nikolas Tezak John Schulman C. McLeavey Jerry Tworek Mark Chen 94 197 0 28 Jul 2022
Toward Transparent AI: A Survey on Interpreting the Inner Structures of Deep Neural Networks Tilman Raukur A. Ho Stephen Casper Dylan Hadfield-Menell AAML AI4CE 133 134 0 27 Jul 2022
Dive into Big Model Training Qinghua Liu Yuxiang Jiang MoMe AI4CE LRM 41 3 0 25 Jul 2022
PanGu-Coder: Program Synthesis with Function-Level Language Modeling Fenia Christopoulou Gerasimos Lampouras Milan Gritta Guchun Zhang Yinpeng Guo ... Guangtai Liang Jia Wei Xin Jiang Qianxiang Wang Qun Liu ELM SyDa ALM 111 76 0 22 Jul 2022
Scaling Laws vs Model Architectures: How does Inductive Bias Influence Scaling? Yi Tay Mostafa Dehghani Samira Abnar Hyung Won Chung W. Fedus J. Rao Sharan Narang Vinh Q. Tran Dani Yogatama Donald Metzler AI4CE 133 107 0 21 Jul 2022
Hidden Progress in Deep Learning: SGD Learns Parities Near the Computational Limit Boaz Barak Benjamin L. Edelman Surbhi Goel Sham Kakade Eran Malach Cyril Zhang 114 133 0 18 Jul 2022
Can large language models reason about medical questions? Valentin Liévin C. Hother Andreas Geert Motzfeldt Ole Winther ELM LM&MA AI4MH LRM 118 315 0 17 Jul 2022
Plex: Towards Reliability using Pretrained Large Model Extensions Dustin Tran J. Liu Michael W. Dusenberry Du Phan Mark Collier ... D. Sculley Y. Gal Zoubin Ghahramani Jasper Snoek Balaji Lakshminarayanan VLM 144 126 0 15 Jul 2022
Confident Adaptive Language Modeling Tal Schuster Adam Fisch Jai Gupta Mostafa Dehghani Dara Bahri Vinh Q. Tran Yi Tay Donald Metzler 155 170 0 14 Jul 2022
Inner Monologue: Embodied Reasoning through Planning with Language Models Wenlong Huang F. Xia Ted Xiao Harris Chan Jacky Liang ... Tomas Jackson Linda Luu Sergey Levine Karol Hausman Brian Ichter LLMAG LM&Ro LRM 211 927 0 12 Jul 2022
Machine Learning Model Sizes and the Parameter Gap Pablo Villalobos J. Sevilla T. Besiroglu Lennart Heim A. Ho Marius Hobbhahn ALM ELM AI4CE 89 60 0 05 Jul 2022