Title
e-CLIP: Large-Scale Vision-Language Representation Learning in E-commerce Wonyoung Shin Jonghun Park Taekang Woo Yongwoo Cho Kwangjin Oh Hwanjun Song VLM 125 17 0 01 Jul 2022
Measuring Forgetting of Memorized Training Examples Matthew Jagielski Om Thakkar Florian Tramèr Daphne Ippolito Katherine Lee ... Eric Wallace Shuang Song Abhradeep Thakurta Nicolas Papernot Chiyuan Zhang TDI 167 111 0 30 Jun 2022
Beyond neural scaling laws: beating power law scaling via data pruning Ben Sorscher Robert Geirhos Shashank Shekhar Surya Ganguli Ari S. Morcos 130 448 0 29 Jun 2022
Long Range Language Modeling via Gated State Spaces Harsh Mehta Ankit Gupta Ashok Cutkosky Behnam Neyshabur Mamba 153 243 0 27 Jun 2022
Repository-Level Prompt Generation for Large Language Models of Code Disha Shrivastava Hugo Larochelle Daniel Tarlow 103 144 0 26 Jun 2022
Scaling Autoregressive Models for Content-Rich Text-to-Image Generation Jiahui Yu Yuanzhong Xu Jing Yu Koh Thang Luong Gunjan Baid ... Zarana Parekh Xin Li Han Zhang Jason Baldridge Yonghui Wu EGVM 299 1,134 0 22 Jun 2022
Questions Are All You Need to Train a Dense Passage Retriever Devendra Singh Sachan M. Lewis Dani Yogatama Luke Zettlemoyer J. Pineau Manzil Zaheer RALM 134 57 0 21 Jun 2022
PlanBench: An Extensible Benchmark for Evaluating Large Language Models on Planning and Reasoning about Change Karthik Valmeekam Matthew Marquez Alberto Olmo S. Sreedharan Subbarao Kambhampati ReLM LRM 117 237 0 21 Jun 2022
LUT-GEMM: Quantized Matrix Multiplication based on LUTs for Efficient Inference in Large-Scale Generative Language Models Gunho Park Baeseong Park Minsub Kim Sungjae Lee Jeonghoon Kim Beomseok Kwon S. Kwon Byeongwook Kim Youngjoo Lee Dongsoo Lee MQ 109 85 0 20 Jun 2022
Resource-Efficient Separation Transformer Luca Della Libera Cem Subakan Mirco Ravanelli Samuele Cornell Frédéric Lepoutre François Grondin VLM 99 18 0 19 Jun 2022
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks Jiasen Lu Christopher Clark Rowan Zellers Roozbeh Mottaghi Aniruddha Kembhavi ObjD VLM MLLM 173 412 0 17 Jun 2022
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge Linxi Fan Guanzhi Wang Yunfan Jiang Ajay Mandlekar Yuncong Yang Haoyi Zhu Andrew Tang De-An Huang Yuke Zhu Anima Anandkumar LM&Ro 157 388 0 17 Jun 2022
Towards Understanding How Machines Can Learn Causal Overhypotheses Eliza Kosoy David M. Chan Adrian Liu Jasmine Collins Bryanna Kaufmann Sandy Han Huang Jessica B. Hamrick John F. Canny Nan Rosemary Ke Alison Gopnik CML AI4CE 107 19 0 16 Jun 2022
Characteristics of Harmful Text: Towards Rigorous Benchmarking of Language Models Maribeth Rauh John F. J. Mellor J. Uesato Po-Sen Huang Johannes Welbl ... Amelia Glaese G. Irving Iason Gabriel William S. Isaac Lisa Anne Hendricks 133 52 0 16 Jun 2022
On Privacy and Personalization in Cross-Silo Federated Learning Ziyu Liu Shengyuan Hu Zhiwei Steven Wu Virginia Smith FedML 113 56 0 16 Jun 2022
Write and Paint: Generative Vision-Language Models are Unified Modal Learners Shizhe Diao Wangchunshu Zhou Xinsong Zhang Jiawei Wang MLLM AI4CE 99 17 0 15 Jun 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 324 2,528 0 15 Jun 2022
VCT: A Video Compression Transformer Fabian Mentzer G. Toderici David C. Minnen S. Hwang Sergi Caelles Mario Lucic E. Agustsson ViT 68 108 0 15 Jun 2022
Efficiently Training Low-Curvature Neural Networks Suraj Srinivas Kyle Matoba Himabindu Lakkaraju François Fleuret AAML 95 16 0 14 Jun 2022
Prioritized Training on Points that are Learnable, Worth Learning, and Not Yet Learnt Sören Mindermann J. Brauner Muhammed Razzak Mrinank Sharma Andreas Kirsch ... Benedikt Höltgen Aidan Gomez Adrien Morisot Sebastian Farquhar Y. Gal 133 166 0 14 Jun 2022
Text Generation with Text-Editing Models Eric Malmi Yue Dong Jonathan Mallinson A. Chuklin Jakub Adamek Daniil Mirylenka Felix Stahlberg Sebastian Krause Shankar Kumar Aliaksei Severyn KELM 64 26 0 14 Jun 2022
LIFT: Language-Interfaced Fine-Tuning for Non-Language Machine Learning Tasks Tuan Dinh Yuchen Zeng Ruisu Zhang Ziqian Lin Michael Gira Shashank Rajput Jy-yong Sohn Dimitris Papailiopoulos Kangwook Lee LMTD 178 140 0 14 Jun 2022
Language Models are General-Purpose Interfaces Y. Hao Haoyu Song Li Dong Shaohan Huang Zewen Chi Wenhui Wang Shuming Ma Furu Wei MLLM 80 102 0 13 Jun 2022
From Human Days to Machine Seconds: Automatically Answering and Generating Machine Learning Final Exams Iddo Drori Sarah J. Zhang Reece Shuttleworth Sarah Zhang Keith Tyser ... Yann Hicke Sage Simhon S. Karnik Darnell Granberry Madeleine Udell ELM 125 10 0 11 Jun 2022
Refining neural network predictions using background knowledge Alessandro Daniele Emile van Krieken Luciano Serafini F. V. Harmelen 85 12 0 10 Jun 2022
Unveiling Transformers with LEGO: a synthetic reasoning task Yi Zhang A. Backurs Sébastien Bubeck Ronen Eldan Suriya Gunasekar Tal Wagner LRM 151 91 0 09 Jun 2022
Neural Collapse: A Review on Modelling Principles and Generalization Vignesh Kothapalli 158 82 0 08 Jun 2022
LegoNN: Building Modular Encoder-Decoder Models Siddharth Dalmia Dmytro Okhonko M. Lewis Sergey Edunov Shinji Watanabe Florian Metze Luke Zettlemoyer Abdel-rahman Mohamed AuLLM MoE 73 14 0 07 Jun 2022
No Parameter Left Behind: How Distillation and Model Size Affect Zero-Shot Retrieval G. Rosa L. Bonifacio Vitor Jeronymo Hugo Queiroz Abonizio Marzieh Fadaee R. Lotufo Rodrigo Nogueira 101 27 0 06 Jun 2022
Making Large Language Models Better Reasoners with Step-Aware Verifier Yifei Li Zeqi Lin Shizhuo Zhang Qiang Fu B. Chen Jian-Guang Lou Weizhu Chen ReLM LRM 125 230 0 06 Jun 2022
Fault-Aware Neural Code Rankers J. Inala Chenglong Wang Mei Yang Andrés Codas Mark Encarnación Shuvendu K. Lahiri Madan Musuvathi Jianfeng Gao ALM 104 45 0 04 Jun 2022
A PDE-based Explanation of Extreme Numerical Sensitivities and Edge of Stability in Training Neural Networks Yuxin Sun Dong Lao G. Sundaramoorthi A. Yezzi 86 3 0 04 Jun 2022
Formal Specifications from Natural Language Christopher Hahn Frederik Schmitt Julia J. Tillman Niklas Metzger Julian Siber Bernd Finkbeiner 105 29 0 04 Jun 2022
ZeroQuant: Efficient and Affordable Post-Training Quantization for Large-Scale Transformers Z. Yao Reza Yazdani Aminabadi Minjia Zhang Xiaoxia Wu Conglong Li Yuxiong He VLM MQ 189 485 0 04 Jun 2022
Understanding the Role of Nonlinearity in Training Dynamics of Contrastive Learning Yuandong Tian MLT 128 14 0 02 Jun 2022
Decentralized Training of Foundation Models in Heterogeneous Environments Binhang Yuan Yongjun He Jared Davis Tianyi Zhang Tri Dao Beidi Chen Percy Liang Christopher Ré Ce Zhang 129 97 0 02 Jun 2022
Language and Culture Internalisation for Human-Like Autotelic AI Cédric Colas Tristan Karch Clément Moulin-Frier Pierre-Yves Oudeyer LM&Ro 102 28 0 02 Jun 2022
A Survey in Mathematical Language Processing Jordan Meadows André Freitas AIMat 63 16 0 30 May 2022
Billions of Parameters Are Worth More Than In-domain Training Data: A case study in the Legal Case Entailment Task G. Rosa L. Bonifacio Vitor Jeronymo Hugo Queiroz Abonizio R. Lotufo Rodrigo Nogueira AILaw ELM 100 11 0 30 May 2022
Precise Learning Curves and Higher-Order Scaling Limits for Dot Product Kernel Regression Lechao Xiao Hong Hu Theodor Misiakiewicz Yue M. Lu Jeffrey Pennington 144 20 0 30 May 2022
Teaching Models to Express Their Uncertainty in Words Stephanie C. Lin Jacob Hilton Owain Evans OOD 142 425 0 28 May 2022
Learning Math Reasoning from Self-Sampled Correct and Partially-Correct Solutions Ansong Ni J. Inala Chenglong Wang Oleksandr Polozov Christopher Meek Dragomir R. Radev Jianfeng Gao ReLM AIMat LRM 101 44 0 28 May 2022
Diffusion-LM Improves Controllable Text Generation Xiang Lisa Li John Thickstun Ishaan Gulrajani Percy Liang Tatsunori B. Hashimoto AI4CE 275 841 0 27 May 2022
GIT: A Generative Image-to-text Transformer for Vision and Language Jianfeng Wang Zhengyuan Yang Xiaowei Hu Linjie Li Kevin Qinghong Lin Zhe Gan Zicheng Liu Ce Liu Lijuan Wang VLM 180 564 0 27 May 2022
Probabilistic Transformer: Modelling Ambiguities and Distributions for RNA Folding and Molecule Design Jörg Franke Frederic Runge Frank Hutter 70 15 0 27 May 2022
Can Foundation Models Help Us Achieve Perfect Secrecy? Simran Arora Christopher Ré FedML 92 8 0 27 May 2022
Inception Transformer Chenyang Si Weihao Yu Pan Zhou Yichen Zhou Xinchao Wang Shuicheng Yan ViT 124 201 0 25 May 2022
Ground-Truth Labels Matter: A Deeper Look into Input-Label Demonstrations Kang Min Yoo Junyeob Kim Sungmin Cho Hyunsoo Cho Hwiyeol Jo Sang-Woo Lee Sang-goo Lee Taeuk Kim 116 129 0 25 May 2022
Training Language Models with Memory Augmentation Zexuan Zhong Tao Lei Danqi Chen RALM 343 133 0 25 May 2022
Autoformalization with Large Language Models Yuhuai Wu Albert Q. Jiang Wenda Li M. Rabe Charles Staats M. Jamnik Christian Szegedy AI4CE 293 178 0 25 May 2022