Title
Kosmos-2: Grounding Multimodal Large Language Models to the World Zhiliang Peng Wenhui Wang Li Dong Y. Hao Shaohan Huang Shuming Ma Furu Wei MLLM ObjD VLM 132 765 0 26 Jun 2023
Exploring the Robustness of Large Language Models for Solving Programming Problems Atsushi Shirafuji Yutaka Watanobe Takumi Ito Makoto Morishita Yuki Nakamura Yusuke Oda Jun Suzuki ELM 99 21 0 26 Jun 2023
ParameterNet: Parameters Are All You Need Kai Han Yunhe Wang Jianyuan Guo Enhua Wu VLM AI4CE 80 31 0 26 Jun 2023
H $_2$ O: Heavy-Hitter Oracle for Efficient Generative Inference of Large Language Models Zhenyu Zhang Ying Sheng Dinesh Manocha Tianlong Chen Lianmin Zheng ... Yuandong Tian Christopher Ré Clark W. Barrett Zhangyang Wang Beidi Chen VLM 241 315 0 24 Jun 2023
Beyond Scale: The Diversity Coefficient as a Data Quality Metric for Variability in Natural Language Data Brando Miranda Alycia Lee Sudharsan Sundar Allison Casasola Rylan Schaeffer Elyas Obbad Sanmi Koyejo 139 17 0 24 Jun 2023
Swin-Free: Achieving Better Cross-Window Attention and Efficiency with Size-varying Window Jinkyu Koo John Yang Le An Gwenaelle Cunha Sergio Su Inn Park ViT 59 0 0 23 Jun 2023
On-Policy Distillation of Language Models: Learning from Self-Generated Mistakes Rishabh Agarwal Nino Vieillard Yongchao Zhou Piotr Stańczyk Sabela Ramos Matthieu Geist Olivier Bachem 114 105 0 23 Jun 2023
Max-Margin Token Selection in Attention Mechanism Davoud Ataee Tarzanagh Yingcong Li Xuechen Zhang Samet Oymak 124 45 0 23 Jun 2023
Knowledge-Infused Self Attention Transformers Kaushik Roy Yuxin Zi Vignesh Narayanan Manas Gaur Amit P. Sheth KELM 62 7 0 23 Jun 2023
Long-range Language Modeling with Self-retrieval Ohad Rubin Jonathan Berant RALM KELM 106 20 0 23 Jun 2023
Product Information Extraction using ChatGPT Alexander Brinkmann Roee Shraga Reng Chiz Der Christian Bizer 43 11 0 23 Jun 2023
ToolQA: A Dataset for LLM Question Answering with External Tools Yuchen Zhuang Yue Yu Kuan-Chieh Wang Haotian Sun Chao Zhang ELM LLMAG 103 252 0 23 Jun 2023
DiversiGATE: A Comprehensive Framework for Reliable Large Language Models Shima Imani Ali Beyram H. Shrivastava 40 1 0 22 Jun 2023
AudioPaLM: A Large Language Model That Can Speak and Listen Paul Kishan Rubenstein Chulayuth Asawaroengchai D. Nguyen Ankur Bapna Zalan Borsos ... Neil Zeghidour Yu Zhang Zhishuai Zhang Lukás Zilka Christian Frank LM&MA AuLLM VLM 149 295 0 22 Jun 2023
AI could create a perfect storm of climate misinformation V. Galaz Hannah Metzler Stefan Daume A. Olsson B. Lindström A. Marklund 124 9 0 22 Jun 2023
Exploring the Landscape of Ubiquitous In-home Health Monitoring: A Comprehensive Survey Farhad Pourpanah Ali Etemad 111 5 0 22 Jun 2023
GPT-Based Models Meet Simulation: How to Efficiently Use Large-Scale Pre-Trained Language Models Across Simulation Tasks Philippe J. Giabbanelli LLMAG ALM AI4CE 75 15 0 21 Jun 2023
Iterated Piecewise Affine (IPA) Approximation for Language Modeling Davood Shamsi Wenhui Hua Brian Williams 67 0 0 21 Jun 2023
OBELICS: An Open Web-Scale Filtered Dataset of Interleaved Image-Text Documents Hugo Laurenccon Lucile Saulnier Léo Tronchon Stas Bekman Amanpreet Singh ... Siddharth Karamcheti Alexander M. Rush Douwe Kiela Matthieu Cord Victor Sanh 174 246 0 21 Jun 2023
SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling Jesse Zhang Karl Pertsch Jiahui Zhang Joseph J. Lim LM&Ro 140 17 0 20 Jun 2023
Textbooks Are All You Need Suriya Gunasekar Yi Zhang J. Aneja C. C. T. Mendes Allison Del Giorno ... Sébastien Bubeck Ronen Eldan Adam Tauman Kalai Y. Lee Yuan-Fang Li AI4CE ALM SyDa 108 411 0 20 Jun 2023
Pushing the Limits of 3D Shape Generation at Scale Wang Yu Xuelin Qian Jingyang Huo Tiejun Huang Bo Zhao Yanwei Fu 134 11 0 20 Jun 2023
Give Us the Facts: Enhancing Large Language Models with Knowledge Graphs for Fact-aware Language Modeling Lin F. Yang Hongyang Chen Zhao Li Xiao Ding Xindong Wu KELM 118 93 0 20 Jun 2023
Democratizing LLMs for Low-Resource Languages by Leveraging their English Dominant Abilities with Linguistically-Diverse Prompts Xuan-Phi Nguyen Sharifah Mahani Aljunied Shafiq Joty Lidong Bing 123 39 0 20 Jun 2023
DropCompute: simple and more robust distributed synchronous training via compute variance reduction Niv Giladi Shahar Gottlieb Moran Shkolnik A. Karnieli Ron Banner Elad Hoffer Kfir Y. Levy Daniel Soudry 104 3 0 18 Jun 2023
Leveraging ChatGPT As Text Annotation Tool For Sentiment Analysis Mohammad Belal James She Simon Wong AI4MH 85 34 0 18 Jun 2023
Instant Soup: Cheap Pruning Ensembles in A Single Pass Can Draw Lottery Tickets from Large Models A. Jaiswal Shiwei Liu Tianlong Chen Ying Ding Zhangyang Wang VLM 115 21 0 18 Jun 2023
CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation Xiwen Liang Liang Ma Shanshan Guo Jianhua Han Hang Xu Shikui Ma Xiaodan Liang LM&Ro LLMAG 165 4 0 17 Jun 2023
ClinicalGPT: Large Language Models Finetuned with Diverse Medical Data and Comprehensive Evaluation Guangyu Wang Guoxing Yang Zongxin Du Longjun Fan Xiaohu Li LM&MA ELM AI4MH 74 88 0 16 Jun 2023
AD-AutoGPT: An Autonomous GPT for Alzheimer's Disease Infodemiology Haixing Dai Yiwei Li Zheng Liu Lin Zhao Zihao Wu ... Quanzheng Li Zhuo Chen D. Zhang Gengchen Mai Tianming Liu LM&MA 115 30 0 16 Jun 2023
No Strong Feelings One Way or Another: Re-operationalizing Neutrality in Natural Language Inference Animesh Nighojkar Antonio Laverghetta John Licato 64 4 0 16 Jun 2023
Is Self-Repair a Silver Bullet for Code Generation? Theo X. Olausson J. Inala Chenglong Wang Jianfeng Gao Armando Solar-Lezama LRM 149 121 0 16 Jun 2023
Pushing the Limits of ChatGPT on NLP Tasks Xiaofei Sun Linfeng Dong Xiaoya Li Zhen Wan Shuhe Wang ... Jiwei Li Fei Cheng Lingjuan Lyu Leilei Gan Guoyin Wang AI4MH LRM 117 32 0 16 Jun 2023
Clickbait Detection via Large Language Models H. Wang Yi Zhu Ye Wang Yun Li Yunhao Yuan Jipeng Qiang 125 3 0 16 Jun 2023
Tell Me Where to Go: A Composable Framework for Context-Aware Embodied Robot Navigation Harel Biggie Ajay Narasimha Mopidevi Dusty Woods Christoffer Heckman LM&Ro 74 11 0 15 Jun 2023
Opportunities and Challenges for ChatGPT and Large Language Models in Biomedicine and Health Shubo Tian Qiao Jin Lana Yeganova Po-Ting Lai Qingqing Zhu ... Donald C. Comeau R. Islamaj Aadit Kapoor Xin Gao Zhiyong Lu LM&MA MedIm AI4MH 184 238 0 15 Jun 2023
Inverse Scaling: When Bigger Isn't Better I. R. McKenzie Alexander Lyzhov Michael Pieler Alicia Parrish Aaron Mueller ... Yuhui Zhang Zhengping Zhou Najoung Kim Sam Bowman Ethan Perez 115 140 0 15 Jun 2023
Segment Any Point Cloud Sequences by Distilling Vision Foundation Models You-Chen Liu Lingdong Kong Jun Cen Runnan Chen Wenwei Zhang Liang Pan Kai-xiang Chen Ziwei Liu 84 91 0 15 Jun 2023
Understanding Optimization of Deep Learning via Jacobian Matrix and Lipschitz Constant Xianbiao Qi Jianan Wang Lei Zhang 73 0 0 15 Jun 2023
Can Language Models Teach Weaker Agents? Teacher Explanations Improve Students via Personalization Swarnadeep Saha Peter Hase Mohit Bansal LRM 80 11 0 15 Jun 2023
Encyclopedic VQA: Visual questions about detailed properties of fine-grained categories Thomas Mensink J. Uijlings Lluis Castrejon A. Goel Felipe Cadar Howard Zhou Fei Sha A. Araújo V. Ferrari 96 44 0 15 Jun 2023
Macaw-LLM: Multi-Modal Language Modeling with Image, Audio, Video, and Text Integration Chenyang Lyu Minghao Wu Longyue Wang Xinting Huang Bingshuai Liu Zefeng Du Shuming Shi Zhaopeng Tu MLLM AuLLM 88 173 0 15 Jun 2023
Interleaving Pre-Trained Language Models and Large Language Models for Zero-Shot NL2SQL Generation Zihui Gu Ju Fan Nan Tang Songyue Zhang Yuxin Zhang Zui Chen Lei Cao Guoliang Li Sam Madden Xiaoyong Du 97 23 0 15 Jun 2023
ArchGym: An Open-Source Gymnasium for Machine Learning Assisted Architecture Design Srivatsan Krishnan Amir Yazdanbaksh Shvetank Prakash Jason J. Jabbour Ikechukwu Uchendu ... Behzad Boroujerdian Daniel Richins Devashree Tripathy Aleksandra Faust Vijay Janapa Reddi 139 14 0 15 Jun 2023
Recipes for Sequential Pre-training of Multilingual Encoder and Seq2Seq Models Saleh Soltan Andrew Rosenbaum Tobias Falke Qin Lu Anna Rumshisky Wael Hamza 76 1 0 14 Jun 2023
When to Use Efficient Self Attention? Profiling Text, Speech and Image Transformer Variants Anuj Diwan Eunsol Choi David Harwath 88 0 0 14 Jun 2023
Radiology-GPT: A Large Language Model for Radiology Zheng Liu Aoxiao Zhong Yiwei Li Longtao Yang Chao Ju ... Wen Liu Dinggang Shen Xiang Li Quanzheng Li Tianming Liu LM&MA MedIm AI4CE 147 61 0 14 Jun 2023
Language to Rewards for Robotic Skill Synthesis Wenhao Yu Nimrod Gileadi Chuyuan Fu Sean Kirmani Kuang-Huei Lee ... N. Heess Dorsa Sadigh Jie Tan Yuval Tassa F. Xia LM&Ro 125 284 0 14 Jun 2023
Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning Nikhil Vyas Depen Morwani Rosie Zhao Gal Kaplun Sham Kakade Boaz Barak MLT 79 4 0 14 Jun 2023
MiniLLM: Knowledge Distillation of Large Language Models Yuxian Gu Li Dong Furu Wei Minlie Huang ALM 160 78 0 14 Jun 2023