Title
HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face Yongliang Shen Kaitao Song Xu Tan Dongsheng Li Weiming Lu Yueting Zhuang MLLM 142 911 0 30 Mar 2023
Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning Vladislav Lialin Vijeta Deshpande Anna Rumshisky 104 179 0 28 Mar 2023
Sigmoid Loss for Language Image Pre-Training Xiaohua Zhai Basil Mustafa Alexander Kolesnikov Lucas Beyer CLIP VLM 275 1,205 0 27 Mar 2023
InterviewBot: Real-Time End-to-End Dialogue System to Interview Students for College Admission Zihao Wang Nathan Keyes Terry Crawford Jinho Choi 48 0 0 27 Mar 2023
Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense Kalpesh Krishna Yixiao Song Marzena Karpinska John Wieting Mohit Iyyer DeLMO 96 325 0 23 Mar 2023
DialogPaint: A Dialog-based Image Editing Model Jingxuan Wei Shiyu Wu Xin Jiang Yequan Wang KELM DiffM 80 5 0 17 Mar 2023
A Short Survey of Viewing Large Language Models in Legal Aspect Zhongxiang Sun AILaw ELM 108 70 0 16 Mar 2023
Streaming Kernel PCA Algorithm With Small Space Yichuan Deng Zhao Song Zifan Wang Hangke Zhang 105 4 0 08 Mar 2023
A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT Yihan Cao Siyu Li Yixin Liu Zhiling Yan Yutong Dai Philip S. Yu Lichao Sun 102 551 0 07 Mar 2023
Extracting Accurate Materials Data from Research Papers with Conversational Language Models and Prompt Engineering Maciej P. Polak Dane Morgan 132 178 0 07 Mar 2023
Prophet: Prompting Large Language Models with Complementary Answer Heuristics for Knowledge-based Visual Question Answering Zhou Yu Xuecheng Ouyang Zhenwei Shao Mei Wang Jun Yu MLLM 176 11 0 03 Mar 2023
SAINE: Scientific Annotation and Inference Engine of Scientific Research Susie Xi Rao Yi-Lin Tu P. Egger 53 1 0 28 Feb 2023
Transformer models: an introduction and catalog X. Amatriain Ananth Sankar Jie Bing Praveen Kumar Bodigutla Timothy J. Hazen Michaeel Kazi 85 53 0 12 Feb 2023
A Reparameterized Discrete Diffusion Model for Text Generation Lin Zheng Jianbo Yuan Lei Yu Lingpeng Kong DiffM 138 69 0 11 Feb 2023
Real-world Machine Learning Systems: A survey from a Data-Oriented Architecture Perspective Christian Cabrera Andrei Paleyes Pierre Thodoroff Neil D. Lawrence AI4TS AI4CE OOD 62 7 0 09 Feb 2023
A Survey on Efficient Training of Transformers Bohan Zhuang Jing Liu Zizheng Pan Haoyu He Yuetian Weng Chunhua Shen 122 49 0 02 Feb 2023
Using In-Context Learning to Improve Dialogue Safety Nicholas Meade Spandana Gella Devamanyu Hazarika Prakhar Gupta Di Jin Siva Reddy Yang Liu Dilek Z. Hakkani-Tür 112 39 0 02 Feb 2023
In-Context Retrieval-Augmented Language Models Ori Ram Yoav Levine Itay Dalmedigos Dor Muhlgay Amnon Shashua Kevin Leyton-Brown Y. Shoham KELM RALM LRM 113 612 0 31 Jan 2023
Emerging Synergies in Causality and Deep Generative Models: A Survey Guanglin Zhou Shaoan Xie Guang-Yuan Hao Shiming Chen Erdun Gao Xiwei Xu Chen Wang Liming Zhu Lina Yao Kun Zhang AI4CE 127 11 0 29 Jan 2023
TikTalk: A Video-Based Dialogue Dataset for Multi-Modal Chitchat in Real World Hongpeng Lin Ludan Ruan Wenke Xia Peiyu Liu Jing Wen ... Di Hu Ruihua Song Wayne Xin Zhao Qin Jin Zhiwu Lu VGen 76 11 0 14 Jan 2023
Data Distillation: A Survey Noveen Sachdeva Julian McAuley DD 92 78 0 11 Jan 2023
Does compressing activations help model parallel training? S. Bian Dacheng Li Hongyi Wang Eric P. Xing Shivaram Venkataraman 59 9 0 06 Jan 2023
Reference Twice: A Simple and Unified Baseline for Few-Shot Instance Segmentation Yue Han Jiangning Zhang Zhucun Xue Chao Xu Xintian Shen Yabiao Wang Chengjie Wang Yong Liu Xiangtai Li 95 17 0 03 Jan 2023
A Survey on In-context Learning Qingxiu Dong Lei Li Damai Dai Ce Zheng Jingyuan Ma ... Zhiyong Wu Baobao Chang Xu Sun Lei Li Zhifang Sui ReLM AIMat 144 539 0 31 Dec 2022
Principled and Efficient Transfer Learning of Deep Models via Neural Collapse Xiao Li Sheng Liu Jin-li Zhou Xin Lu C. Fernandez‐Granda Zhihui Zhu Q. Qu AAML 91 20 0 23 Dec 2022
Language Models as Inductive Reasoners Zonglin Yang Li Dong Xinya Du Hao Cheng Min Zhang Xiaodong Liu Jianfeng Gao Furu Wei ReLM LRM 87 37 0 21 Dec 2022
JASMINE: Arabic GPT Models for Few-Shot Learning El Moatez Billah Nagoudi Muhammad Abdul-Mageed AbdelRahim Elmadany Alcides Alcoba Inciarte Md. Tawkat Islam Khondaker 69 8 0 21 Dec 2022
Does CLIP Bind Concepts? Probing Compositionality in Large Image Models Martha Lewis Nihal V. Nayak Peilin Yu Qinan Yu Jack Merullo Stephen H. Bach Ellie Pavlick VLM OCL CoGe 132 68 0 20 Dec 2022
SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization Hyunwoo J. Kim Jack Hessel Liwei Jiang Peter West Ximing Lu ... Ronan Le Bras Malihe Alikhani Gunhee Kim Maarten Sap Yejin Choi HILM 132 169 0 20 Dec 2022
Is GPT-3 a Good Data Annotator? Bosheng Ding Chengwei Qin Linlin Liu Yew Ken Chia Shafiq Joty Boyang Albert Li Lidong Bing 95 249 0 20 Dec 2022
CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Data Limitation With Contrastive Learning Xiaoming Liu Zhaohan Zhang Yichen Wang Hang Pu Y. Lan Chao Shen 92 41 0 20 Dec 2022
Large Language Models Are Reasoning Teachers Namgyu Ho Laura Schmid Se-Young Yun ReLM ELM LRM 128 351 0 20 Dec 2022
When Federated Learning Meets Pre-trained Language Models' Parameter-Efficient Tuning Methods Zhuo Zhang Yuanhang Yang Yong Dai Zhuang Li Zenglin Xu FedML 124 81 0 20 Dec 2022
On Second Thought, Let's Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning Omar Shaikh Hongxin Zhang William B. Held Michael S. Bernstein Diyi Yang ReLM LRM 149 200 0 15 Dec 2022
A Comprehensive Survey on Enterprise Financial Risk Analysis from Big Data Perspective Yu Zhao Huaming Du Qing Li Fuzhen Zhuang Ji Liu Gang Kou Gang Kou 151 1 0 28 Nov 2022
Deanthropomorphising NLP: Can a Language Model Be Conscious? Matthew Shardlow Piotr Przybyła 64 7 0 21 Nov 2022
Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adaptors Thomas Hartvigsen S. Sankaranarayanan Hamid Palangi Yoon Kim Marzyeh Ghassemi KELM 140 177 0 20 Nov 2022
SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models Guangxuan Xiao Ji Lin Mickael Seznec Hao Wu Julien Demouth Song Han MQ 242 841 0 18 Nov 2022
Deep Emotion Recognition in Textual Conversations: A Survey Patrícia Pereira Helena Moniz Joao Paulo Carvalho 86 16 0 16 Nov 2022
GAMMT: Generative Ambiguity Modeling Using Multiple Transformers Xingcheng Xu 69 0 0 16 Nov 2022
Knowledge Graph Embedding: A Survey from the Perspective of Representation Spaces Jiahang Cao Jinyuan Fang Zaiqiao Meng Shangsong Liang 98 70 0 07 Nov 2022
Two-stage LLM Fine-tuning with Less Specialization and More Generalization Yihan Wang Si Si Daliang Li Michal Lukasik Felix X. Yu Cho-Jui Hsieh Inderjit S Dhillon Sanjiv Kumar 137 30 0 01 Nov 2022
A Causal Framework to Quantify the Robustness of Mathematical Reasoning with Language Models Alessandro Stolfo Zhijing Jin Kumar Shridhar Bernhard Schölkopf Mrinmaya Sachan ELM OOD LRM 124 66 0 21 Oct 2022
Taxonomy of Abstractive Dialogue Summarization: Scenarios, Approaches and Future Directions Qi Jia Yizhu Liu Siyu Ren Kenny Q. Zhu 65 8 0 18 Oct 2022
LLMEffiChecker: Understanding and Testing Efficiency Degradation of Large Language Models Simin Chen Cong Liu Mirazul Haque Wei Yang 79 24 0 07 Oct 2022
Differentially Private Optimization on Large Model at Small Cost Zhiqi Bu Yu Wang Sheng Zha George Karypis 100 55 0 30 Sep 2022
Differentially Private Bias-Term Fine-tuning of Foundation Models Zhiqi Bu Yu Wang Sheng Zha George Karypis 117 48 0 30 Sep 2022
What Makes Pre-trained Language Models Better Zero-shot Learners? Jinghui Lu Dongsheng Zhu Weidong Han Rui Zhao Brian Mac Namee Fei Tan 87 24 0 30 Sep 2022
YATO: Yet Another deep learning based Text analysis Open toolkit Zeqiang Wang Yile Wang Jiageng Wu Zhiyang Teng Jie Yang 89 3 0 28 Sep 2022
Lex2Sent: A bagging approach to unsupervised sentiment analysis Kai-Robin Lange Jonas Rieger Carsten Jentsch SSL 32 2 0 26 Sep 2022