Title
Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data Kashun Shum Shizhe Diao Tong Zhang ReLM LRM 121 138 0 24 Feb 2023
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback Baolin Peng Michel Galley Pengcheng He Hao Cheng Yujia Xie ... Qiuyuan Huang Lars Liden Zhou Yu Weizhu Chen Jianfeng Gao KELM HILM LRM 118 402 0 24 Feb 2023
Language-Driven Representation Learning for Robotics Siddharth Karamcheti Suraj Nair Annie S. Chen Thomas Kollar Chelsea Finn Dorsa Sadigh Percy Liang LM&Ro SSL 138 156 0 24 Feb 2023
MUX-PLMs: Data Multiplexing for High-throughput Language Models Vishvak Murahari Ameet Deshpande Carlos E. Jimenez Izhak Shafran Mingqiu Wang Yuan Cao Karthik Narasimhan MoE 63 5 0 24 Feb 2023
In What Languages are Generative Language Models the Most Formal? Analyzing Formality Distribution across Languages Asim Ersoy Gerson Vizcarra T. Mayeesha Benjamin Muller 72 2 0 23 Feb 2023
Active Prompting with Chain-of-Thought for Large Language Models Shizhe Diao Pengcheng Wang Yong Lin Tong Zhang ReLM KELM LLMAG LRM 137 133 0 23 Feb 2023
On the Generalization Ability of Retrieval-Enhanced Transformers Tobias Norlund Ehsan Doostmohammadi Richard Johansson Marco Kuhlmann RALM 67 6 0 23 Feb 2023
Sentence Simplification via Large Language Models Yutao Feng Jipeng Qiang Yun Li Yunhao Yuan Yi Zhu 94 19 0 23 Feb 2023
Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions? Yang Chen Hexiang Hu Yi Luan Haitian Sun Soravit Changpinyo Alan Ritter Ming-Wei Chang 152 94 0 23 Feb 2023
AlpaServe: Statistical Multiplexing with Model Parallelism for Deep Learning Serving Zhuohan Li Lianmin Zheng Yinmin Zhong Vincent Liu Ying Sheng ... Yanping Huang Zhifeng Chen Hao Zhang Joseph E. Gonzalez Ion Stoica MoE 59 68 0 22 Feb 2023
Scaling Robot Learning with Semantically Imagined Experience Tianhe Yu Ted Xiao Austin Stone Jonathan Tompson Anthony Brohan ... M. Dee Jodilyn Peralta Brian Ichter Karol Hausman F. Xia LM&Ro DiffM 98 155 0 22 Feb 2023
How Does In-Context Learning Help Prompt Tuning? Simeng Sun Yang Liu Dan Iter Chenguang Zhu Mohit Iyyer VLM 72 19 0 22 Feb 2023
Guiding Large Language Models via Directional Stimulus Prompting Zekun Li Baolin Peng Pengcheng He Michel Galley Jianfeng Gao Xi Yan LLMAG LRM LM&Ro 139 101 0 22 Feb 2023
Open-domain Visual Entity Recognition: Towards Recognizing Millions of Wikipedia Entities Hexiang Hu Yi Luan Yang Chen Urvashi Khandelwal Mandar Joshi Kenton Lee Kristina Toutanova Ming-Wei Chang VLM 136 61 0 22 Feb 2023
Optical Transformers Maxwell G. Anderson Shifan Ma Tianyu Wang Logan G. Wright Peter L. McMahon 51 23 0 20 Feb 2023
Learning Deep Semantics for Test Completion Pengyu Nie Rahul Banerjee Junyi Jessy Li Raymond J. Mooney Miloš Gligorić 109 63 0 20 Feb 2023
Poisoning Web-Scale Training Datasets is Practical Nicholas Carlini Matthew Jagielski Christopher A. Choquette-Choo Daniel Paleka Will Pearce Hyrum S. Anderson Andreas Terzis Kurt Thomas Florian Tramèr SILM 131 204 0 20 Feb 2023
TA-MoE: Topology-Aware Large Scale Mixture-of-Expert Training Chang-Qin Chen Min Li Zhihua Wu Dianhai Yu Chao Yang MoE 61 15 0 20 Feb 2023
Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation Lorenz Kuhn Y. Gal Sebastian Farquhar UQLM 244 313 0 19 Feb 2023
Can ChatGPT Understand Too? A Comparative Study on ChatGPT and Fine-tuned BERT Qihuang Zhong Liang Ding Juhua Liu Bo Du Dacheng Tao AI4MH 148 245 0 19 Feb 2023
Learning Language Representations with Logical Inductive Bias Jianshu Chen NAI AI4CE LRM 55 3 0 19 Feb 2023
Machine Love Joel Lehman 129 5 0 18 Feb 2023
How Good Are GPT Models at Machine Translation? A Comprehensive Evaluation Amr Hendy M. Abdelrehim Amr Sharaf Vikas Raunak Mohamed Gabr Hitokazu Matsushita Young Jin Kim Mohamed Afify Hany Awadalla ELM LM&MA AI4CE 85 441 0 18 Feb 2023
RETVec: Resilient and Efficient Text Vectorizer Elie Bursztein Marina Zhang Owen Vallis Xinyu Jia Alexey Kurakin VLM 82 4 0 18 Feb 2023
Bounding the Capabilities of Large Language Models in Open Text Generation with Prompt Constraints Albert Lu Hongxin Zhang Yanzhe Zhang Xuezhi Wang Diyi Yang LRM 85 32 0 17 Feb 2023
Improving Training Stability for Multitask Ranking Models in Recommender Systems Jiaxi Tang Yoel Drori Daryl Chang M. Sathiamoorthy Justin Gilmer Li Wei Xinyang Yi Lichan Hong Ed H. Chi 100 10 0 17 Feb 2023
Complex QA and language models hybrid architectures, Survey Xavier Daull P. Bellot Emmanuel Bruno Vincent Martin Elisabeth Murisasco ELM 221 16 0 17 Feb 2023
Multiperiodic Processes: Ergodic Sources with a Sublinear Entropy L. Debowski MILM 122 11 0 17 Feb 2023
Auditing large language models: a three-layered approach Jakob Mokander Jonas Schuett Hannah Rose Kirk Luciano Floridi AILaw MLAU 169 216 0 16 Feb 2023
LEVER: Learning to Verify Language-to-Code Generation with Execution Ansong Ni Srini Iyer Dragomir R. Radev Ves Stoyanov Wen-tau Yih Sida I. Wang Xi Lin 145 227 0 16 Feb 2023
Auto-Parallelizing Large Models with Rhino: A Systematic Approach on Production AI Platform Shiwei Zhang Lansong Diao Siyu Wang Zongyan Cao Yiliang Gu Chang Si Ziji Shi Zhen Zheng Chuan Wu W. Lin AI4CE 61 4 0 16 Feb 2023
Slapo: A Schedule Language for Progressive Optimization of Large Deep Learning Model Training Hongzheng Chen Cody Hao Yu Shuai Zheng Zhen Zhang Zhiru Zhang Yida Wang 84 8 0 16 Feb 2023
ANSEL Photobot: A Robot Event Photographer with Semantic Intelligence D. Rivkin Gregory Dudek Nikhil Kakodkar David Meger Oliver Limoyo Xue Liu F. Hogan LM&Ro 69 6 0 15 Feb 2023
Platform-Independent and Curriculum-Oriented Intelligent Assistant for Higher Education Ramteja Sajja Y. Sermet David M. Cwiertny Ibrahim Demir 60 68 0 15 Feb 2023
Speculative Decoding with Big Little Decoder Sehoon Kim K. Mangalam Suhong Moon Jitendra Malik Michael W. Mahoney A. Gholami Kurt Keutzer MoE 147 113 0 15 Feb 2023
Augmented Language Models: a Survey Grégoire Mialon Roberto Dessì Maria Lomeli Christoforos Nalmpantis Ramakanth Pasunuru ... Jane Dwivedi-Yu Asli Celikyilmaz Edouard Grave Yann LeCun Thomas Scialom LRM KELM 105 394 0 15 Feb 2023
Studying the effect of AI Code Generators on Supporting Novice Learners in Introductory Programming Majeed Kazemitabaar J. Chow Carl Ka To Ma B. Ericson David Weintrop Tovi Grossman AI4Ed ELM 56 228 0 15 Feb 2023
Adding Instructions during Pretraining: Effective Way of Controlling Toxicity in Language Models Shrimai Prabhumoye M. Patwary Mohammad Shoeybi Bryan Catanzaro LM&MA 59 21 0 14 Feb 2023
Neurosymbolic AI for Reasoning over Knowledge Graphs: A Survey L. Delong Ramon Fernández Mir Jacques D. Fleuriot NAI 126 13 0 14 Feb 2023
On the Planning Abilities of Large Language Models (A Critical Investigation with a Proposed Benchmark) Karthik Valmeekam S. Sreedharan Matthew Marquez Alberto Olmo Hernandez Subbarao Kambhampati LLMAG LRM 82 79 0 13 Feb 2023
Gradient-Based Automated Iterative Recovery for Parameter-Efficient Tuning Maximilian Mozes Tolga Bolukbasi Ann Yuan Frederick Liu Nithum Thain Lucas Dixon 67 5 0 13 Feb 2023
Towards Agile Text Classifiers for Everyone Maximilian Mozes Jessica Hoffmann Katrin Tomanek Muhamed Kouate Nithum Thain Ann Yuan Tolga Bolukbasi Lucas Dixon 103 13 0 13 Feb 2023
A Unified View of Long-Sequence Models towards Modeling Million-Scale Dependencies Hongyu Hè Marko Kabić 78 2 0 13 Feb 2023
Expediting Distributed DNN Training with Device Topology-Aware Graph Deployment Shiwei Zhang Xiaodong Yi Lansong Diao Chuan Wu Siyu Wang W. Lin GNN 54 5 0 13 Feb 2023
The Framework Tax: Disparities Between Inference Efficiency in NLP Research and Deployment Jared Fernandez Jacob Kahn Clara Na Yonatan Bisk Emma Strubell FedML 91 11 0 13 Feb 2023
Policy-Induced Self-Supervision Improves Representation Finetuning in Visual RL Sébastien M. R. Arnold Fei Sha SSL 57 0 0 12 Feb 2023
Team Triple-Check at Factify 2: Parameter-Efficient Large Foundation Models with Feature Representations for Multi-Modal Fact Verification Wei-Wei Du Hongfa Wu Wei-Yao Wang Chao-Han Huck Yang 74 7 0 12 Feb 2023
Transformer models: an introduction and catalog X. Amatriain Ananth Sankar Jie Bing Praveen Kumar Bodigutla Timothy J. Hazen Michaeel Kazi 150 53 0 12 Feb 2023
Characterizing Attribution and Fluency Tradeoffs for Retrieval-Augmented Large Language Models Renat Aksitov Chung-Ching Chang David Reitter Siamak Shakeri Yun-hsuan Sung RALM 80 16 0 11 Feb 2023
Distillation of encoder-decoder transformers for sequence labelling M. Farina D. Pappadopulo Anant Gupta Leslie Huang Ozan Irsoy Thamar Solorio VLM 205 3 0 10 Feb 2023