Title
(QA) $^2$ : Question Answering with Questionable Assumptions Najoung Kim Phu Mon Htut Sam Bowman Jackson Petty 122 39 0 20 Dec 2022
Towards Understanding Chain-of-Thought Prompting: An Empirical Study of What Matters Boshi Wang Sewon Min Xiang Deng Jiaming Shen You Wu Luke Zettlemoyer Huan Sun LRM ReLM 150 253 0 20 Dec 2022
Improved Long-Form Spoken Language Translation with Large Language Models Arya D. McCarthy Haotong Zhang Shankar Kumar Felix Stahlberg Axel H. Ng 76 2 0 19 Dec 2022
Python Code Generation by Asking Clarification Questions Haau-Sing Li Mohsen Mesgar André F. T. Martins Iryna Gurevych 70 11 0 19 Dec 2022
Training Trajectories of Language Models Across Scales Mengzhou Xia Mikel Artetxe Chunting Zhou Xi Lin Ramakanth Pasunuru Danqi Chen Luke Zettlemoyer Ves Stoyanov AIFin LRM 98 64 0 19 Dec 2022
A Retrieve-and-Read Framework for Knowledge Graph Link Prediction Vardaan Pahuja Boshi Wang Hugo Latapie Jayanth Srinivasa Yu-Chuan Su 91 13 0 19 Dec 2022
Optimizing Prompts for Text-to-Image Generation Y. Hao Zewen Chi Li Dong Furu Wei 128 153 0 19 Dec 2022
Explanation Regeneration via Information Bottleneck Qintong Li Zhiyong Wu Lingpeng Kong Wei Bi 93 4 0 19 Dec 2022
Reasoning with Language Model Prompting: A Survey Shuofei Qiao Yixin Ou Ningyu Zhang Xiang Chen Yunzhi Yao Shumin Deng Chuanqi Tan Fei Huang Huajun Chen ReLM ELM LRM 234 327 0 19 Dec 2022
$Mu$^{2}$SLAM: Multitask, Multilingual Speech and Language Models$ Mu $^{2}$ SLAM: Multitask, Multilingual Speech and Language Models Yong Cheng Yu Zhang Melvin Johnson Wolfgang Macherey Ankur Bapna 66 8 0 19 Dec 2022
Latent Diffusion for Language Generation Justin Lovelace Varsha Kishore Chao-gang Wan Eliot Shekhtman Kilian Q. Weinberger DiffM 134 82 0 19 Dec 2022
Large Language Models Meet NL2Code: A Survey Daoguang Zan B. Chen Fengji Zhang Di Lu Bingchao Wu Bei Guan Yongji Wang Jian-Guang Lou ELM ALM 97 183 0 19 Dec 2022
Natural Language to Code Generation in Interactive Data Science Notebooks Pengcheng Yin Wen-Ding Li Kefan Xiao Abhishek Rao Yeming Wen ... Paige Bailey Michele Catasta Henryk Michalewski Oleksandr Polozov Charles Sutton 91 66 0 19 Dec 2022
Rethinking the Role of Scale for In-Context Learning: An Interpretability-based Case Study at 66 Billion Scale Hritik Bansal Karthik Gopalakrishnan Saket Dingliwal S. Bodapati Katrin Kirchhoff Dan Roth LRM 93 51 0 18 Dec 2022
3D Point Cloud Pre-training with Knowledge Distillation from 2D Images Yuan Yao Yuanhan Zhang Zhen-fei Yin Jiebo Luo Wanli Ouyang Xiaoshui Huang 3DPC 85 10 0 17 Dec 2022
Improving Cross-task Generalization of Unified Table-to-text Models with Compositional Task Configurations Jifan Chen Yuhao Zhang Lan Liu Rui Dong Xinchi Chen Patrick Ng William Yang Wang Zhiheng Huang AI4CE 71 4 0 17 Dec 2022
Rarely a problem? Language models exhibit inverse scaling in their predictions following few-type quantifiers J. Michaelov Benjamin Bergen 46 17 0 16 Dec 2022
Evaluating Step-by-Step Reasoning through Symbolic Verification Yi-Fan Zhang Hanlin Zhang Li Erran Li Eric P. Xing ReLM LRM 99 8 0 16 Dec 2022
Plansformer: Generating Symbolic Plans using Transformers Vishal Pallagani Bharath Muppasani K. Murugesan F. Rossi L. Horesh Biplav Srivastava F. Fabiano Andrea Loreggia LM&Ro LLMAG OffRL 74 38 0 16 Dec 2022
Self-Prompting Large Language Models for Zero-Shot Open-Domain QA Junlong Li Jinyuan Wang Zhuosheng Zhang Hai Zhao LRM 97 38 0 16 Dec 2022
MURMUR: Modular Multi-Step Reasoning for Semi-Structured Data-to-Text Generation Swarnadeep Saha Xinyan Velocity Yu Joey Tianyi Zhou Ramakanth Pasunuru Asli Celikyilmaz ReLM LRM 66 11 0 16 Dec 2022
Teaching Small Language Models to Reason Lucie Charlotte Magister Jonathan Mallinson Jakub Adamek Eric Malmi Aliaksei Severyn LRM AI4CE ReLM 252 268 0 16 Dec 2022
Feature Dropout: Revisiting the Role of Augmentations in Contrastive Learning Alex Tamkin Margalit Glasgow Xiluo He Noah D. Goodman SSL 123 7 0 16 Dec 2022
ALERT: Adapting Language Models to Reasoning Tasks Ping Yu Tianlu Wang O. Yu. Golovneva Badr AlKhamissi Siddharth Verma Zhijing Jin Gargi Ghosh Mona T. Diab Asli Celikyilmaz ReLM LRM 87 19 0 16 Dec 2022
CLIPPO: Image-and-Language Understanding from Pixels Only Michael Tschannen Basil Mustafa N. Houlsby CLIP VLM 107 49 0 15 Dec 2022
Attributed Question Answering: Evaluation and Modeling for Attributed Large Language Models Bernd Bohnet Vinh Q. Tran Pat Verga Roee Aharoni D. Andor ... Michael Collins Dipanjan Das Donald Metzler Slav Petrov Kellie Webster 128 65 0 15 Dec 2022
ROSCOE: A Suite of Metrics for Scoring Step-by-Step Reasoning O. Yu. Golovneva Moya Chen Spencer Poff Martin Corredor Luke Zettlemoyer Maryam Fazel-Zarandi Asli Celikyilmaz ReLM LRM 119 152 0 15 Dec 2022
Manifestations of Xenophobia in AI Systems Nenad Tomašev J. L. Maynard Iason Gabriel 102 9 0 15 Dec 2022
A fine-grained comparison of pragmatic language understanding in humans and language models Jennifer Hu Sammy Floyd Olessia Jouravlev Evelina Fedorenko E. Gibson 77 63 0 13 Dec 2022
Evaluation of Synthetic Datasets for Conversational Recommender Systems Harsh Lara Manoj Kumar Tiwari SyDa 35 7 0 12 Dec 2022
On Pre-Training for Visuo-Motor Control: Revisiting a Learning-from-Scratch Baseline Nicklas Hansen Zhecheng Yuan Yanjie Ze Tongzhou Mu Aravind Rajeswaran H. Su Huazhe Xu Xiaolong Wang 99 66 0 12 Dec 2022
Elixir: Train a Large Language Model on a Small GPU Cluster Haichen Huang Jiarui Fang Hongxin Liu Shenggui Li Yang You VLM 83 7 0 10 Dec 2022
Structured information extraction from complex scientific text with fine-tuned large language models Alex Dunn John Dagdelen Nicholas Walker Sanghoon Lee Andrew S. Rosen Gerbrand Ceder Kristin A. Persson Anubhav Jain 99 93 0 10 Dec 2022
REVEAL: Retrieval-Augmented Visual-Language Pre-Training with Multi-Source Multimodal Knowledge Memory Ziniu Hu Ahmet Iscen Chen Sun Zirui Wang Kai-Wei Chang Yizhou Sun Cordelia Schmid David A. Ross Alireza Fathi RALM VLM 110 96 0 10 Dec 2022
Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints Aran Komatsuzaki J. Puigcerver James Lee-Thorp Carlos Riquelme Ruiz Basil Mustafa Joshua Ainslie Yi Tay Mostafa Dehghani N. Houlsby MoMe MoE 108 124 0 09 Dec 2022
General-Purpose In-Context Learning by Meta-Learning Transformers Louis Kirsch James Harrison Jascha Narain Sohl-Dickstein Luke Metz 137 78 0 08 Dec 2022
OFASys: A Multi-Modal Multi-Task Learning System for Building Generalist Models Jinze Bai Rui Men Han Yang Xuancheng Ren Kai Dang ... Wenhang Ge Jianxin Ma Junyang Lin Jingren Zhou Chang Zhou 88 16 0 08 Dec 2022
EPCL: Frozen CLIP Transformer is An Efficient Point Cloud Encoder Xiaoshui Huang Zhou Huang Shengjia Li Wentao Qu Tong He Yuenan Hou Yifan Zuo Wanli Ouyang 114 13 0 08 Dec 2022
Successive Prompting for Decomposing Complex Questions Dheeru Dua Shivanshu Gupta Sameer Singh Matt Gardner ReLM LRM 113 118 0 08 Dec 2022
LLM-Planner: Few-Shot Grounded Planning for Embodied Agents with Large Language Models Chan Hee Song Jiaman Wu Clay Washington Brian M Sadler Wei-Lun Chao Yu-Chuan Su LLMAG LM&Ro 202 425 0 08 Dec 2022
Harnessing Knowledge and Reasoning for Human-Like Natural Language Generation: A Brief Review Jiangjie Chen Yanghua Xiao 118 5 0 07 Dec 2022
The problem with AI consciousness: A neurogenetic case against synthetic sentience Yoshija Walter L. Zbinden 62 1 0 07 Dec 2022
DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing Conglong Li Z. Yao Xiaoxia Wu Minjia Zhang Connor Holmes Cheng Li Yuxiong He 71 25 0 07 Dec 2022
Talking About Large Language Models Murray Shanahan AI4CE 136 275 0 07 Dec 2022
I2MVFormer: Large Language Model Generated Multi-View Document Supervision for Zero-Shot Image Classification Muhammad Ferjad Naeem Muhammad Gul Zain Ali Khan Yongqin Xian Muhammad Zeshan Afzal D. Stricker Luc Van Gool F. Tombari VLM 89 56 0 05 Dec 2022
Toward Efficient Language Model Pretraining and Downstream Adaptation via Self-Evolution: A Case Study on SuperGLUE Qihuang Zhong Liang Ding Yibing Zhan Yu Qiao Yonggang Wen ... Yixin Chen Xinbo Gao Steven C. H. Hoi Xiaoou Tang Dacheng Tao VLM ELM 132 35 0 04 Dec 2022
Language Models as Agent Models Jacob Andreas LLMAG 92 141 0 03 Dec 2022
Nonparametric Masked Language Modeling Sewon Min Weijia Shi M. Lewis Xilun Chen Wen-tau Yih Hannaneh Hajishirzi Luke Zettlemoyer RALM 168 51 0 02 Dec 2022
Simplifying and Understanding State Space Models with Diagonal Linear RNNs Ankit Gupta Harsh Mehta Jonathan Berant 75 21 0 01 Dec 2022
Task Discovery: Finding the Tasks that Neural Networks Generalize on Andrei Atanov Andrei Filatov Teresa Yeo Ajay Sohmshetty Amir Zamir OOD 139 10 0 01 Dec 2022