Title
Learning from Mistakes via Cooperative Study Assistant for Large Language Models Danqing Wang Lei Li 80 8 0 23 May 2023
Concept-aware Training Improves In-context Learning Ability of Language Models Michal Štefánik Marek Kadlcík KELM LRM 89 0 0 23 May 2023
i-Code Studio: A Configurable and Composable Framework for Integrative AI Yuwei Fang Mahmoud Khademi Chenguang Zhu Ziyi Yang Reid Pryzant ... Yao Qian Takuya Yoshioka Lu Yuan Michael Zeng Xuedong Huang 86 2 0 23 May 2023
CombLM: Adapting Black-Box Language Models through Small Fine-Tuned Models Aitor Ormazabal Mikel Artetxe Eneko Agirre 94 21 0 23 May 2023
Exploring Self-supervised Logic-enhanced Training for Large Language Models Fangkai Jiao Zhiyang Teng Bosheng Ding Zhengyuan Liu Nancy F. Chen Shafiq Joty ReLM LRM 90 5 0 23 May 2023
ChatGPT as your Personal Data Scientist Md. Mahadi Hassan Alex Knipper Shubhra (Santu) Karmaker LM&MA LLMAG AI4CE 141 18 0 23 May 2023
InstructAlign: High-and-Low Resource Language Alignment via Continual Crosslingual Instruction Tuning Samuel Cahyawijaya Holy Lovenia Tiezheng Yu Willy Chung Pascale Fung ALM 93 15 0 23 May 2023
Small Language Models Improve Giants by Rewriting Their Outputs Giorgos Vernikos Arthur Bravzinskas Jakub Adamek Jonathan Mallinson Aliaksei Severyn Eric Malmi BDL LRM 100 16 0 22 May 2023
Can ChatGPT Detect Intent? Evaluating Large Language Models for Spoken Language Understanding Mutian He Philip N. Garner ELM AI4MH LRM 119 25 0 22 May 2023
Element-aware Summarization with Large Language Models: Expert-aligned Evaluation and Chain-of-Thought Method Yiming Wang Zhuosheng Zhang Rui Wang 117 88 0 22 May 2023
Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching Yang Liu Muzhi Zhu Hengtao Li Hao Chen Xinlong Wang Chunhua Shen VLM MLLM 188 90 0 22 May 2023
Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts Jian Xie Kai Zhang Jiangjie Chen Renze Lou Yu-Chuan Su RALM 328 181 0 22 May 2023
Investigating the Role of Feed-Forward Networks in Transformers Using Parallel Attention and Feed-Forward Net Design Shashank Sonkar Richard G. Baraniuk 66 4 0 22 May 2023
VideoLLM: Modeling Video Sequence with Large Language Models Guo Chen Yin-Dong Zheng Jiahao Wang Jilan Xu Yifei Huang ... Yi Wang Yali Wang Yu Qiao Tong Lu Limin Wang MLLM 157 84 0 22 May 2023
Let GPT be a Math Tutor: Teaching Math Word Problem Solvers with Customized Exercise Generation Zhenwen Liang Wenhao Yu Tanmay Rajpurohit Peter Clark Xiangliang Zhang Ashwin Kaylan 72 38 0 22 May 2023
CLASS: A Design Framework for building Intelligent Tutoring Systems based on Learning Science principles Shashank Sonkar Lucy Liu D. B. Mallick Richard G. Baraniuk 111 42 0 22 May 2023
Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources Xingxuan Li Ruochen Zhao Yew Ken Chia Bosheng Ding Shafiq Joty Soujanya Poria Lidong Bing HILM BDL LRM 148 102 0 22 May 2023
GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints Joshua Ainslie James Lee-Thorp Michiel de Jong Yury Zemlyanskiy Federico Lebrón Sumit Sanghai 149 709 0 22 May 2023
SPARSEFIT: Few-shot Prompting with Sparse Fine-tuning for Jointly Generating Predictions and Natural Language Explanations Jesus Solano Oana-Maria Camburu Pasquale Minervini 75 1 0 22 May 2023
To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis Fuzhao Xue Yao Fu Wangchunshu Zhou Zangwei Zheng Yang You 155 86 0 22 May 2023
Multi-Task Instruction Tuning of LLaMa for Specific Scenarios: A Preliminary Study on Writing Assistance Yue Zhang Leyang Cui Deng Cai Xinting Huang Tao Fang Wei Bi ALM 98 36 0 22 May 2023
SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization Evaluation Elizabeth Clark Shruti Rijhwani Sebastian Gehrmann Joshua Maynez Roee Aharoni Vitaly Nikolaev Thibault Sellam Aditya Siddhant Dipanjan Das Ankur P. Parikh 97 41 0 22 May 2023
A Pretrainer's Guide to Training Data: Measuring the Effects of Data Age, Domain Coverage, Quality, & Toxicity Shayne Longpre Gregory Yauney Emily Reif Katherine Lee Adam Roberts ... Denny Zhou Jason W. Wei Kevin Robinson David M. Mimno Daphne Ippolito 127 168 0 22 May 2023
Response Length Perception and Sequence Scheduling: An LLM-Empowered LLM Inference Pipeline Zangwei Zheng Xiaozhe Ren Fuzhao Xue Yang Luo Xin Jiang Yang You 88 64 0 22 May 2023
Observations on LLMs for Telecom Domain: Capabilities and Limitations Sumit Soman G. RanjaniH 63 27 0 22 May 2023
InheritSumm: A General, Versatile and Compact Summarizer by Distilling from GPT Yichong Xu Ruochen Xu Dan Iter Yang Liu Shuohang Wang Chenguang Zhu Michael Zeng 58 10 0 22 May 2023
Making Language Models Better Tool Learners with Execution Feedback Shuofei Qiao Honghao Gui Chengfei Lv Qianghuai Jia Huajun Chen Ningyu Zhang LLMAG 164 53 0 22 May 2023
RWKV: Reinventing RNNs for the Transformer Era Bo Peng Eric Alcaide Quentin G. Anthony Alon Albalak Samuel Arcadinho ... Qihang Zhao P. Zhou Qinghua Zhou Jian Zhu Rui-Jie Zhu 242 614 0 22 May 2023
Getting ViT in Shape: Scaling Laws for Compute-Optimal Model Design Ibrahim Alabdulmohsin Xiaohua Zhai Alexander Kolesnikov Lucas Beyer VLM 160 64 0 22 May 2023
Iterative Forward Tuning Boosts In-Context Learning in Language Models Jiaxi Yang Binyuan Hui Min Yang Bailin Wang Bowen Li Binhua Li Fei Huang Yongbin Li 127 16 0 22 May 2023
Textually Pretrained Speech Language Models Michael Hassid Tal Remez Tu Nguyen Itai Gat Alexis Conneau ... Alexandre Défossez Gabriel Synnaeve Emmanuel Dupoux Roy Schwartz Yossi Adi VLM SyDa 138 61 0 22 May 2023
GPT-SW3: An Autoregressive Language Model for the Nordic Languages Ariel Ekgren Amaru Cuba Gyllensten Felix Stollenwerk Joey Öhman T. Isbister Evangelia Gogoulou F. Carlsson Alice Heiman Judit Casademont Magnus Sahlgren 88 13 0 22 May 2023
Language Models for German Text Simplification: Overcoming Parallel Data Scarcity through Style-specific Pre-training Miriam Anschütz Joshua Oehms Thomas Wimmer Bartlomiej Jezierski Georg Groh 74 22 0 22 May 2023
Crosslingual Transfer Learning for Low-Resource Languages Based on Multilingual Colexification Graphs Yihong Liu Haotian Ye Leonie Weissweiler Renhao Pei Hinrich Schütze 95 11 0 22 May 2023
Farewell to Aimless Large-scale Pretraining: Influential Subset Selection for Language Model Xiao Wang Wei Zhou Qi Zhang Jie Zhou Songyang Gao Junzhe Wang Menghan Zhang Xiang Gao Yunwen Chen Tao Gui 129 10 0 22 May 2023
Interactive Data Synthesis for Systematic Vision Adaptation via LLMs-AIGCs Collaboration Qifan Yu Juncheng Li Wentao Ye Siliang Tang Yueting Zhuang 73 14 0 22 May 2023
GraphCare: Enhancing Healthcare Predictions with Personalized Knowledge Graphs Pengcheng Jiang Cao Xiao Adam Cross Jimeng Sun AI4MH 97 24 0 22 May 2023
This Prompt is Measuring <MASK>: Evaluating Bias Evaluation in Language Models Seraphina Goldfarb-Tarrant Eddie L. Ungless Esma Balkir Su Lin Blodgett 105 10 0 22 May 2023
A Benchmark on Extremely Weakly Supervised Text Classification: Reconcile Seed Matching and Prompting Approaches Zihan Wang Tianle Wang Dheeraj Mekala Jingbo Shang VLM 84 8 0 22 May 2023
Enhancing Small Medical Learners with Privacy-preserving Contextual Prompting Xinlu Zhang Shiyang Li Xianjun Yang Chenxin Tian Yao Qin Linda R. Petzold 136 9 0 22 May 2023
Beyond Labels: Empowering Human Annotators with Natural Language Explanations through a Novel Active-Learning Architecture Bingsheng Yao Ishan Jindal Lucian Popa Yannis Katsis Sayan Ghosh ... Yuxuan Lu Shashank Srivastava Yunyao Li James A. Hendler Dakuo Wang 79 11 0 22 May 2023
Quantifying Association Capabilities of Large Language Models and Its Implications on Privacy Leakage Hanyin Shao Jie Huang Shen Zheng Kevin Chen-Chuan Chang PILM 68 30 0 22 May 2023
FIT: Far-reaching Interleaved Transformers Ting-Li Chen Lala Li 112 13 0 22 May 2023
UVOSAM: A Mask-free Paradigm for Unsupervised Video Object Segmentation via Segment Anything Model Zhenghao Zhang Shengfan Zhang Zhichao Wei Zuozhuo Dai Siyu Zhu VOS VLM 103 18 0 22 May 2023
BertRLFuzzer: A BERT and Reinforcement Learning Based Fuzzer Piyush Jha Joseph Scott Jaya Sriram Ganeshna M. Singh Vijay Ganesh 49 5 0 21 May 2023
TheoremQA: A Theorem-driven Question Answering dataset Wenhu Chen Ming Yin Max Ku Pan Lu Yixin Wan Xueguang Ma Jianyu Xu Xinyi Wang Tony Xia AIMat 133 140 0 21 May 2023
DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection Xiao Yu Yuang Qi Kejiang Chen Guoqiang Chen Xi Yang Pengyuan Zhu Xiuwei Shang Weiming Zhang Neng H. Yu DeLMO 73 11 0 21 May 2023
PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMs Paul Burgess Nigel Collier Wray Buntine Ehsan Shareghi 124 41 0 21 May 2023
Glot500: Scaling Multilingual Corpora and Language Models to 500 Languages Ayyoob Imani Peiqin Lin Amir Hossein Kargaran Silvia Severini Masoud Jalili Sabet ... Chunlan Ma Helmut Schmid André F. T. Martins François Yvon Hinrich Schütze ALM LRM 142 107 0 20 May 2023
Lifting the Curse of Capacity Gap in Distilling Language Models Chen Zhang Yang Yang Jiahao Liu Jingang Wang Yunsen Xian Benyou Wang Dawei Song MoE 77 20 0 20 May 2023