Title
Increasing Probability Mass on Answer Choices Does Not Always Improve Accuracy Sarah Wiegreffe Matthew Finlayson Oyvind Tafjord Peter Clark Ashish Sabharwal 85 7 0 24 May 2023
ExpertPrompting: Instructing Large Language Models to be Distinguished Experts Benfeng Xu An Yang Junyang Lin Quang Wang Chang Zhou Yongdong Zhang Zhendong Mao ALM 126 142 0 24 May 2023
IdealGPT: Iteratively Decomposing Vision and Language Reasoning via Large Language Models Haoxuan You Rui Sun Zhecan Wang Long Chen Gengyu Wang Hammad A. Ayyubi Kai-Wei Chang Shih-Fu Chang VLM MLLM LRM 150 44 0 24 May 2023
All Roads Lead to Rome? Exploring the Invariance of Transformers' Representations Yuxin Ren Qipeng Guo Zhijing Jin Shauli Ravfogel Mrinmaya Sachan Bernhard Schölkopf Ryan Cotterell 77 4 0 23 May 2023
MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems Jakub Macina Nico Daheim Sankalan Pal Chowdhury Tanmay Sinha Manu Kapur Iryna Gurevych Mrinmaya Sachan LRM 129 68 0 23 May 2023
Deduction under Perturbed Evidence: Probing Student Simulation Capabilities of Large Language Models Shashank Sonkar Richard G. Baraniuk 33 1 0 23 May 2023
Advancing Precise Outline-Conditioned Text Generation with Task Duality and Explicit Outline Control Yunzhe Li Qian Chen Weixiang Yan Wen Wang Qinglin Zhang Hari Sundaram 77 3 0 23 May 2023
Graph Meets LLM: A Novel Approach to Collaborative Filtering for Robust Conversational Understanding Zheng Chen Ziyan Jiang Fan Yang Eunah Cho Xing Fan Xiaojiang Huang Yanbin Lu Aram Galstyan 78 10 0 23 May 2023
Exploring Contrast Consistency of Open-Domain Question Answering Systems on Minimally Edited Questions Zhihan Zhang Wenhao Yu Zheng Ning Mingxuan Ju Meng Jiang 74 4 0 23 May 2023
Schema-Driven Information Extraction from Heterogeneous Tables Fan Bai Junmo Kang Gabriel Stanovsky Dayne Freitag Alan Ritter LMTD 89 14 0 23 May 2023
DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation Susung Hong Junyoung Seo Heeseong Shin Sung‐Jin Hong Seung Wook Kim DiffM VGen 106 36 0 23 May 2023
FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation Sewon Min Kalpesh Krishna Xinxi Lyu M. Lewis Wen-tau Yih Pang Wei Koh Mohit Iyyer Luke Zettlemoyer Hannaneh Hajishirzi HILM ALM 253 705 0 23 May 2023
On Learning to Summarize with Large Language Models as References Yixin Liu Kejian Shi Katherine S He Longtian Ye Alexander R. Fabbri Pengfei Liu Dragomir R. Radev Arman Cohan ELM 119 82 0 23 May 2023
Pre-training Multi-task Contrastive Learning Models for Scientific Literature Understanding Yu Zhang Hao Cheng Zhihong Shen Xiaodong Liu Yejiang Wang Jianfeng Gao 92 14 0 23 May 2023
ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media Kung-Hsiang Huang Hou Pong Chan Kathleen McKeown Heng Ji 95 1 0 23 May 2023
Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks Tiedong Liu K. H. Low ALM 91 87 0 23 May 2023
TVTSv2: Learning Out-of-the-box Spatiotemporal Visual Representations at Scale Ziyun Zeng Yixiao Ge Zhan Tong Xihui Liu Shutao Xia Ying Shan 82 9 0 23 May 2023
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization Jeonghoon Kim J. H. Lee Sungdong Kim Joonsuk Park Kang Min Yoo S. Kwon Dongsoo Lee MQ 157 106 0 23 May 2023
Parts of Speech-Grounded Subspaces in Vision-Language Models James Oldfield Christos Tzelepis Yannis Panagakis M. Nicolaou Ioannis Patras 85 9 0 23 May 2023
Embrace Opportunities and Face Challenges: Using ChatGPT in Undergraduate Students' Collaborative Interdisciplinary Learning Gaoxia Zhu Xiuyi Fan Chenyu Hou Tianlong Zhong P. Seow Annabel Chen Shen-Hsing Preman Rajalingam Low Kin Yew Tan Lay Poh 58 11 0 23 May 2023
Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation Takyoung Kim Jamin Shin Young-Ho Kim Sanghwan Bae Sungdong Kim 97 1 0 23 May 2023
"Is the Pope Catholic?" Applying Chain-of-Thought Reasoning to Understanding Conversational Implicatures Zae Myung Kim David E. Taylor Dongyeop Kang ReLM LRM AI4CE 27 5 0 23 May 2023
Aligning Large Language Models through Synthetic Feedback Sungdong Kim Sanghwan Bae Jamin Shin Soyoung Kang Donghyun Kwak Kang Min Yoo Minjoon Seo ALM SyDa 155 70 0 23 May 2023
Continual Dialogue State Tracking via Example-Guided Question Answering Hyundong Justin Cho Andrea Madotto Zhaojiang Lin Khyathi Chandu Satwik Kottur Jing Xu Jonathan May Chinnadhurai Sankar CLL 83 3 0 23 May 2023
Training Priors Predict Text-To-Image Model Performance Charles Lovering Ellie Pavlick CoGe 78 3 0 23 May 2023
Natural Language Decompositions of Implicit Content Enable Better Text Representations Alexander Miserlis Hoyle Rupak Sarkar Pranav Goel Philip Resnik AI4CE 216 15 0 23 May 2023
A Study of Generative Large Language Model for Medical Research and Healthcare C.A.I. Peng Xi Yang Aokun Chen Kaleb E. Smith Nima M. Pournejatian ... W. Hogan E. Shenkman Yi Guo Jiang Bian Yonghui Wu LM&MA ELM AI4MH 218 273 0 22 May 2023
Can ChatGPT Detect Intent? Evaluating Large Language Models for Spoken Language Understanding Mutian He Philip N. Garner ELM AI4MH LRM 119 25 0 22 May 2023
Clembench: Using Game Play to Evaluate Chat-Optimized Language Models as Conversational Agents Kranti Chalamalasetti Jana Gotze Sherzod Hakimov Brielen Madureira P. Sadler David Schlangen ELM ALM LLMAG 99 36 0 22 May 2023
Element-aware Summarization with Large Language Models: Expert-aligned Evaluation and Chain-of-Thought Method Yiming Wang Zhuosheng Zhang Rui Wang 117 88 0 22 May 2023
Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching Yang Liu Muzhi Zhu Hengtao Li Hao Chen Xinlong Wang Chunhua Shen VLM MLLM 181 90 0 22 May 2023
Measuring Inductive Biases of In-Context Learning with Underspecified Demonstrations Chenglei Si Dan Friedman Nitish Joshi Shi Feng Danqi Chen He He 81 48 0 22 May 2023
AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback Yann Dubois Xuechen Li Rohan Taori Tianyi Zhang Ishaan Gulrajani Jimmy Ba Carlos Guestrin Percy Liang Tatsunori B. Hashimoto ALM 156 608 0 22 May 2023
LM vs LM: Detecting Factual Errors via Cross Examination Roi Cohen May Hamri Mor Geva Amir Globerson HILM 126 144 0 22 May 2023
To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis Fuzhao Xue Yao Fu Wangchunshu Zhou Zangwei Zheng Yang You 149 86 0 22 May 2023
Multi-Task Instruction Tuning of LLaMa for Specific Scenarios: A Preliminary Study on Writing Assistance Yue Zhang Leyang Cui Deng Cai Xinting Huang Tao Fang Wei Bi ALM 94 36 0 22 May 2023
SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization Evaluation Elizabeth Clark Shruti Rijhwani Sebastian Gehrmann Joshua Maynez Roee Aharoni Vitaly Nikolaev Thibault Sellam Aditya Siddhant Dipanjan Das Ankur P. Parikh 95 41 0 22 May 2023
A Pretrainer's Guide to Training Data: Measuring the Effects of Data Age, Domain Coverage, Quality, & Toxicity Shayne Longpre Gregory Yauney Emily Reif Katherine Lee Adam Roberts ... Denny Zhou Jason W. Wei Kevin Robinson David M. Mimno Daphne Ippolito 117 168 0 22 May 2023
Table Meets LLM: Can Large Language Models Understand Structured Table Data? A Benchmark and Empirical Study Yuan Sui Mengyu Zhou Mingjie Zhou Shi Han Dongmei Zhang LMTD 137 93 0 22 May 2023
RWKV: Reinventing RNNs for the Transformer Era Bo Peng Eric Alcaide Quentin G. Anthony Alon Albalak Samuel Arcadinho ... Qihang Zhao P. Zhou Qinghua Zhou Jian Zhu Rui-Jie Zhu 240 614 0 22 May 2023
SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented Dialogue Agents Shuzheng Si Wen-Cheng Ma Haoyu Gao Yuchuan Wu Ting-En Lin Yinpei Dai Hangyu Li Rui Yan Fei Huang Yongbin Li AuLLM 176 37 0 22 May 2023
GPT-SW3: An Autoregressive Language Model for the Nordic Languages Ariel Ekgren Amaru Cuba Gyllensten Felix Stollenwerk Joey Öhman T. Isbister Evangelia Gogoulou F. Carlsson Alice Heiman Judit Casademont Magnus Sahlgren 88 13 0 22 May 2023
Album Storytelling with Iterative Story-aware Captioning and Large Language Models Munan Ning Yujia Xie Dongdong Chen Zeyin Song Lu Yuan Yonghong Tian QiXiang Ye Liuliang Yuan 76 8 0 22 May 2023
Leveraging Human Feedback to Scale Educational Datasets: Combining Crowdworkers and Comparative Judgement Owen Henkel Libby Hills 66 1 0 22 May 2023
Lion: Adversarial Distillation of Proprietary Large Language Models Yuxin Jiang Chunkit Chan Yin Hua Wei Wang ALM 108 25 0 22 May 2023
Can We Edit Factual Knowledge by In-Context Learning? Ce Zheng Lei Li Qingxiu Dong Yuxuan Fan Zhiyong Wu Jingjing Xu Baobao Chang KELM 88 217 0 22 May 2023
Enhancing Small Medical Learners with Privacy-preserving Contextual Prompting Xinlu Zhang Shiyang Li Xianjun Yang Chenxin Tian Yao Qin Linda R. Petzold 131 9 0 22 May 2023
TheoremQA: A Theorem-driven Question Answering dataset Wenhu Chen Ming Yin Max Ku Pan Lu Yixin Wan Xueguang Ma Jianyu Xu Xinyi Wang Tony Xia AIMat 131 140 0 21 May 2023
i-Code V2: An Autoregressive Generation Framework over Vision, Language, and Speech Data Ziyi Yang Mahmoud Khademi Yichong Xu Reid Pryzant Yuwei Fang ... Yu Shi Lu Yuan Takuya Yoshioka Michael Zeng Xuedong Huang 68 2 0 21 May 2023
Collaborative Development of NLP models Fereshte Khani Marco Tulio Ribeiro 80 2 0 20 May 2023