Title
SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling Jesse Zhang Karl Pertsch Jiahui Zhang Joseph J. Lim LM&Ro 45 17 0 20 Jun 2023
Dense Video Object Captioning from Disjoint Supervision Xingyi Zhou Anurag Arnab Chen Sun Cordelia Schmid 41 3 0 20 Jun 2023
A Simple and Effective Pruning Approach for Large Language Models Mingjie Sun Zhuang Liu Anna Bair J. Zico Kolter 90 364 0 20 Jun 2023
Pushing the Limits of 3D Shape Generation at Scale Wang Yu Xuelin Qian Jingyang Huo Tiejun Huang Bo Zhao Yanwei Fu 49 11 0 20 Jun 2023
Give Us the Facts: Enhancing Large Language Models with Knowledge Graphs for Fact-aware Language Modeling Lin F. Yang Hongyang Chen Zhao Li Xiao Ding Xindong Wu KELM 45 88 0 20 Jun 2023
Large Language Models are Fixated by Red Herrings: Exploring Creative Problem Solving and Einstellung Effect using the Only Connect Wall Dataset S. Naeini Raeid Saqur M. Saeidi John Giorgi Babak Taati 50 8 0 19 Jun 2023
BayLing: Bridging Cross-lingual Alignment and Instruction Following through Interactive Translation for Large Language Models Shaolei Zhang Qingkai Fang Zhuocheng Zhang Zhengrui Ma Yan Zhou ... Mengyu Bu Shangtong Gui Yunji Chen Xilin Chen Yang Feng ALM 77 40 0 19 Jun 2023
Multilingual Few-Shot Learning via Language Model Retrieval Genta Indra Winata Liang-Kang Huang Soumya Vadlamannati Yash Chandarana RALM 47 2 0 19 Jun 2023
Leveraging ChatGPT As Text Annotation Tool For Sentiment Analysis Mohammad Belal James She Simon Wong AI4MH 25 31 0 18 Jun 2023
LLMVA-GEBC: Large Language Model with Video Adapter for Generic Event Boundary Captioning Yunlong Tang Jinrui Zhang Xiangchen Wang Teng Wang Feng Zheng VLM 76 9 0 17 Jun 2023
Just One Byte (per gradient): A Note on Low-Bandwidth Decentralized Language Model Finetuning Using Shared Randomness E. Zelikman Qian Huang Percy Liang Nick Haber Noah D. Goodman 70 14 0 16 Jun 2023
Pushing the Limits of ChatGPT on NLP Tasks Xiaofei Sun Linfeng Dong Xiaoya Li Zhen Wan Shuhe Wang ... Jiwei Li Fei Cheng Lingjuan Lyu Fei Wu Guoyin Wang AI4MH LRM 49 29 0 16 Jun 2023
Investigating Prompting Techniques for Zero- and Few-Shot Visual Question Answering Rabiul Awal Le Zhang Aishwarya Agrawal LRM 51 12 0 16 Jun 2023
Block-State Transformers Mahan Fathi Jonathan Pilault Orhan Firat C. Pal Pierre-Luc Bacon Ross Goroshin 47 17 0 15 Jun 2023
Inverse Scaling: When Bigger Isn't Better I. R. McKenzie Alexander Lyzhov Michael Pieler Alicia Parrish Aaron Mueller ... Yuhui Zhang Zhengping Zhou Najoung Kim Sam Bowman Ethan Perez 46 128 0 15 Jun 2023
Recurrent Action Transformer with Memory A. Staroverov A. Bessonov Dmitry A. Yudin A. Kovalev Aleksandr I. Panov OffRL 46 4 0 15 Jun 2023
Segment Any Point Cloud Sequences by Distilling Vision Foundation Models You-Chen Liu Lingdong Kong Jun Cen Runnan Chen Wenwei Zhang Liang Pan Kai-xiang Chen Ziwei Liu 40 83 0 15 Jun 2023
Understanding Optimization of Deep Learning via Jacobian Matrix and Lipschitz Constant Xianbiao Qi Jianan Wang Lei Zhang 21 0 0 15 Jun 2023
Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models Myles Foley Ambrish Rawat Taesung Lee Yufang Hou Gabriele Picco Giulio Zizzo DeLMO 43 5 0 15 Jun 2023
CMMLU: Measuring massive multitask language understanding in Chinese Haonan Li Yixuan Zhang Fajri Koto Yifei Yang Hai Zhao Yeyun Gong Nan Duan Tim Baldwin ALM ELM 47 246 0 15 Jun 2023
Recipes for Sequential Pre-training of Multilingual Encoder and Seq2Seq Models Saleh Soltan Andrew Rosenbaum Tobias Falke Qin Lu Anna Rumshisky Wael Hamza 35 0 0 14 Jun 2023
WizardCoder: Empowering Code Large Language Models with Evol-Instruct Ziyang Luo Can Xu Pu Zhao Qingfeng Sun Xiubo Geng Wenxiang Hu Chongyang Tao Jing Ma Qingwei Lin Daxin Jiang SyDa ALM ELM 34 647 0 14 Jun 2023
MiniLLM: Knowledge Distillation of Large Language Models Yuxian Gu Li Dong Furu Wei Minlie Huang ALM 49 77 0 14 Jun 2023
INT2.1: Towards Fine-Tunable Quantized Large Language Models with Error Correction through Low-Rank Adaptation Yuji Chai John Gkountouras Glenn G. Ko David Brooks Gu-Yeon Wei MQ 38 19 0 13 Jun 2023
AutoML in the Age of Large Language Models: Current Challenges, Future Opportunities and Risks Alexander Tornede Difan Deng Theresa Eimer Joseph Giovanelli Aditya Mohan ... Sarah Segel Daphne Theodorakopoulos Tanja Tornede Henning Wachsmuth Marius Lindauer 41 23 0 13 Jun 2023
MOFI: Learning Image Representations from Noisy Entity Annotated Images Wentao Wu Aleksei Timofeev Chen Chen Bowen Zhang Kun Duan ... Yantao Zheng Jonathon Shlens Xianzhi Du Zhe Gan Yinfei Yang VLM 29 7 0 13 Jun 2023
WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences Xiao Liu Hanyu Lai Hao Yu Yifan Xu Aohan Zeng Zhengxiao Du Peng Zhang Yuxiao Dong Jie Tang 17 97 0 13 Jun 2023
SqueezeLLM: Dense-and-Sparse Quantization Sehoon Kim Coleman Hooper A. Gholami Zhen Dong Xiuyu Li Sheng Shen Michael W. Mahoney Kurt Keutzer MQ 38 168 0 13 Jun 2023
Probing Quantifier Comprehension in Large Language Models: Another Example of Inverse Scaling Akshat Gupta ELM LRM 32 7 0 12 Jun 2023
Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow Wenqi Zhang Yongliang Shen Weiming Lu Yueting Zhuang LLMAG 42 51 0 12 Jun 2023
Augmenting Language Models with Long-Term Memory Weizhi Wang Li Dong Hao Cheng Xiaodong Liu Xifeng Yan Jianfeng Gao Furu Wei KELM RALM 46 84 0 12 Jun 2023
Gradient Ascent Post-training Enhances Language Model Generalization Dongkeun Yoon Joel Jang Sungdong Kim Minjoon Seo VLM AI4CE 31 3 0 12 Jun 2023
AraMUS: Pushing the Limits of Data and Model Scale for Arabic Natural Language Processing Asaad Alghamdi Xinyu Duan Wei Jiang Zhenhai Wang Yimeng Wu ... Yifei Zheng Mehdi Rezagholizadeh Baoxing Huai Peilun Cheng Abbas Ghaddar VLM 34 8 0 11 Jun 2023
Language Versatilists vs. Specialists: An Empirical Revisiting on Multilingual Transfer Ability Jiacheng Ye Xijia Tao Lingpeng Kong LRM 39 24 0 11 Jun 2023
EaSyGuide : ESG Issue Identification Framework leveraging Abilities of Generative Large Language Models Hanwool Albert Lee Jonghyun Choi Sohyeon Kwon Sungbum Jung 27 3 0 11 Jun 2023
Boosting Language Models Reasoning with Chain-of-Knowledge Prompting Rongxiang Weng Qiushi Sun Xiang Li Ming Gao ReLM LRM 26 65 0 10 Jun 2023
Human-in-the-Loop through Chain-of-Thought Zefan Cai Baobao Chang Wenjuan Han LRM 30 24 0 10 Jun 2023
The Age of Synthetic Realities: Challenges and Opportunities J. P. Cardenuto Jing Yang Rafael Padilha Renjie Wan Daniel Moreira Haoliang Li Shiqi Wang Fernanda A. Andaló Sébastien Marcel Anderson de Rezende Rocha DeLMO 47 29 0 09 Jun 2023
Evaluating the Social Impact of Generative AI Systems in Systems and Society Irene Solaiman Zeerak Talat William Agnew Lama Ahmad Dylan K. Baker ... Marie-Therese Png Shubham Singh A. Strait Lukas Struppek Arjun Subramonian ELM EGVM 46 104 0 09 Jun 2023
Can Large Language Models Infer Causation from Correlation? Zhijing Jin Jiarui Liu Zhiheng Lyu Spencer Poff Mrinmaya Sachan Rada Mihalcea Mona T. Diab Bernhard Schölkopf LRM 37 117 0 09 Jun 2023
Customizing General-Purpose Foundation Models for Medical Report Generation Bang-ju Yang Asif Raza Yuexian Zou Tong Zhang MedIm 38 11 0 09 Jun 2023
Artificial General Intelligence for Medical Imaging Xiang Li Lu Zhang Zihao Wu Zheng Liu Lin Zhao ... Pingkuan Yan Quanzheng Li Wen Liu Tianming Liu Dinggang Shen LM&MA AI4CE 37 40 0 08 Jun 2023
Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models Muhammad Maaz H. Rasheed Salman Khan Fahad Shahbaz Khan MLLM 61 595 0 08 Jun 2023
PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark for Finance Qianqian Xie Weiguang Han Xiao Zhang Yanzhao Lai Min Peng Alejandro Lopez-Lira Jimin Huang ALM 26 141 0 08 Jun 2023
PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization Yidong Wang Zhuohao Yu Zhengran Zeng Linyi Yang Cunxiang Wang ... Jindong Wang Xingxu Xie Wei Ye Shi-Bo Zhang Yue Zhang ALM ELM 66 231 0 08 Jun 2023
INSTRUCTEVAL: Towards Holistic Evaluation of Instruction-Tuned Large Language Models Yew Ken Chia Pengfei Hong Lidong Bing Soujanya Poria ELM 33 63 0 07 Jun 2023
How Far Can Camels Go? Exploring the State of Instruction Tuning on Open Resources Yizhong Wang Hamish Ivison Pradeep Dasigi Jack Hessel Tushar Khot ... David Wadden Kelsey MacMillan Noah A. Smith Iz Beltagy Hannaneh Hajishirzi ALM ELM 36 372 0 07 Jun 2023
Soft-prompt Tuning for Large Language Models to Evaluate Bias Jacob-Junqi Tian David B. Emerson Sevil Zanjani Miyandoab D. Pandya Laleh Seyyed-Kalantari Faiza Khan Khattak VLM 31 10 0 07 Jun 2023
Improving Open Language Models by Learning from Organic Interactions Jing Xu Da Ju Joshua Lane M. Komeili Eric Michael Smith ... Rashel Moritz Sainbayar Sukhbaatar Y-Lan Boureau Jason Weston Kurt Shuster 38 9 0 07 Jun 2023
On the Reliability of Watermarks for Large Language Models John Kirchenbauer Jonas Geiping Yuxin Wen Manli Shu Khalid Saifullah Kezhi Kong Kasun Fernando Aniruddha Saha Micah Goldblum Tom Goldstein WaLM 32 113 0 07 Jun 2023