Title
Beyond Task Performance: Evaluating and Reducing the Flaws of Large Multimodal Models with In-Context Learning Mustafa Shukor Alexandre Ramé Corentin Dancette Matthieu Cord LRM MLLM 56 21 0 01 Oct 2023
Faithful Explanations of Black-box NLP Models Using LLM-generated Counterfactuals Y. Gat Nitay Calderon Amir Feder Alexander Chapanin Amit Sharma Roi Reichart 48 29 0 01 Oct 2023
Pink: Unveiling the Power of Referential Comprehension for Multi-modal LLMs Shiyu Xuan Qingpei Guo Ming Yang Shiliang Zhang MLLM ObjD 18 38 0 01 Oct 2023
GrowLength: Accelerating LLMs Pretraining by Progressively Growing Training Length Hongye Jin Xiaotian Han Jingfeng Yang Zhimeng Jiang Chia-Yuan Chang Xia Hu 46 11 0 01 Oct 2023
From Language Modeling to Instruction Following: Understanding the Behavior Shift in LLMs after Instruction Tuning Xuansheng Wu Wenlin Yao Jianshu Chen Xiaoman Pan Xiaoyang Wang Ninghao Liu Dong Yu LRM 28 28 0 30 Sep 2023
ValueDCG: Measuring Comprehensive Human Value Understanding Ability of Language Models Zhaowei Zhang Fengshuo Bai Jun Gao Yaodong Yang PILM ELM 23 2 0 30 Sep 2023
AutomaTikZ: Text-Guided Synthesis of Scientific Vector Graphics with TikZ Jonas Belouadi Anne Lauscher Steffen Eger 35 28 0 30 Sep 2023
Decoding In-Context Learning: Neuroscience-inspired Analysis of Representations in Large Language Models Safoora Yousefi Leo Betthauser Hosein Hasanbeig Raphael Milliere Ida Momennejad 29 4 0 30 Sep 2023
Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration Qiushi Sun Zhangyue Yin Xiang Li Zhiyong Wu Xipeng Qiu Lingpeng Kong LRM LLMAG 41 44 0 30 Sep 2023
AutoHall: Automated Hallucination Dataset Generation for Large Language Models Zouying Cao Yifei Yang Hai Zhao HILM 20 8 0 30 Sep 2023
Bridging the Gap Between Foundation Models and Heterogeneous Federated Learning Sixing Yu J. P. Muñoz Ali Jannesari AI4CE 87 8 0 30 Sep 2023
Motif: Intrinsic Motivation from Artificial Intelligence Feedback Martin Klissarov P. DÓro Shagun Sodhani Roberta Raileanu Pierre-Luc Bacon Pascal Vincent Amy Zhang Mikael Henaff LRM LLMAG 42 55 0 29 Sep 2023
One for All: Towards Training One Graph Model for All Classification Tasks Hao Liu Jiarui Feng Lecheng Kong Ningyue Liang Dacheng Tao Yixin Chen Muhan Zhang AI4CE 26 115 0 29 Sep 2023
SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation Hangfeng He Hongming Zhang Dan Roth LRM ELM ReLM 32 14 0 29 Sep 2023
Efficient Streaming Language Models with Attention Sinks Michel Lang Yuandong Tian Beidi Chen Song Han Mike Lewis AI4TS RALM 44 666 0 29 Sep 2023
ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving Zhibin Gou Zhihong Shao Yeyun Gong Yelong Shen Yujiu Yang Minlie Huang Nan Duan Weizhu Chen LRM AI4CE LLMAG 61 146 0 29 Sep 2023
L2CEval: Evaluating Language-to-Code Generation Capabilities of Large Language Models Ansong Ni Pengcheng Yin Yilun Zhao Chen Wei Yanjun Wang ... Mingyuan Zhang Chen Change Loy Yingbo Zhou Dragomir R. Radev Arman Cohan ELM 32 19 0 29 Sep 2023
CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets Lifan Yuan Yangyi Chen Xingyao Wang Yi R. Fung Hao Peng Heng Ji LLMAG KELM 38 58 0 29 Sep 2023
Data Filtering Networks Alex Fang Albin Madappally Jose Amit Jain Ludwig Schmidt Alexander Toshev Vaishaal Shankar CLIP 48 127 0 29 Sep 2023
Can Sensitive Information Be Deleted From LLMs? Objectives for Defending Against Extraction Attacks Vaidehi Patil Peter Hase Joey Tianyi Zhou KELM AAML 31 101 0 29 Sep 2023
Open-Sourcing Highly Capable Foundation Models: An evaluation of risks, benefits, and alternative methods for pursuing open-source objectives Elizabeth Seger Noemi Dreksler Richard Moulange Emily Dardaman Jonas Schuett ... Emma Bluemke Michael Aird Patrick Levermore Julian Hazell Abhishek Gupta 30 40 0 29 Sep 2023
Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4 Jiaxian Guo Bo Yang Paul D. Yoo Bill Yuchen Lin Yusuke Iwasawa Yutaka Matsuo LLMAG 31 41 0 29 Sep 2023
Training and inference of large language models using 8-bit floating point Sergio P. Perez Yan Zhang James Briggs Charlie Blake Prashanth Krishnamurthy Paul Balanca Carlo Luschi Stephen Barlow Andrew William Fitzgibbon MQ 42 18 0 29 Sep 2023
Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training Xidong Feng Bo Liu Muning Wen Stephen Marcus McAleer Ying Wen Weinan Zhang Jun Wang LRM AI4CE 38 161 0 29 Sep 2023
DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks A. Maritan Jiaao Chen S. Dey Luca Schenato Diyi Yang Xing Xie ELM LRM 34 44 0 29 Sep 2023
Prototype Generation: Robust Feature Visualisation for Data Independent Interpretability Ziyin Li Bao Feng 36 1 0 29 Sep 2023
Benchmarking Cognitive Biases in Large Language Models as Evaluators Ryan Koo Minhwa Lee Vipul Raheja Jong Inn Park Zae Myung Kim Dongyeop Kang ALM 45 76 0 29 Sep 2023
Understanding and Mitigating the Label Noise in Pre-training on Downstream Tasks Hao Chen Jindong Wang Ankit Shah Ran Tao Hongxin Wei Berfin cSimcsek Masashi Sugiyama Bhiksha Raj 49 27 0 29 Sep 2023
TranDRL: A Transformer-Driven Deep Reinforcement Learning Enabled Prescriptive Maintenance Framework Yang Zhao Jiaxi Yang Wenbo Wang Helin Yang Dusit Niyato AI4TS AI4CE 21 7 0 29 Sep 2023
Curriculum-Driven Edubot: A Framework for Developing Language Learning Chatbots Through Synthesizing Conversational Data Yu Li Shang Qu Jili Shen Shangchao Min Zhou Yu 54 17 0 28 Sep 2023
MindShift: Leveraging Large Language Models for Mental-States-Based Problematic Smartphone Use Intervention Paraskevi Nousi Chun Yu Xiaole Pan Yujia Liu Theodoros Manousis ... Zhi Zheng Li Chen Avraam Tsantekidis Xuhai Xu Yuanchun Shi 37 22 0 28 Sep 2023
GPT-Fathom: Benchmarking Large Language Models to Decipher the Evolutionary Path towards GPT-4 and Beyond Timothée Darcet Yuyu Zhang Yijie Zhu Chenguang Xi Pengyang Gao Piotr Bojanowski Kevin Chen-Chuan Chang ELM 35 24 0 28 Sep 2023
A Benchmark for Learning to Translate a New Language from One Grammar Book Garrett Tanzer Mirac Suzgun Chenguang Xi Dan Jurafsky Luke Melas-Kyriazi 35 51 0 28 Sep 2023
Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation Guy Yariv Itai Gat Sagie Benaim Lior Wolf Idan Schwartz Yossi Adi DiffM VGen 47 38 0 28 Sep 2023
QwenGrasp: A Usage of Large Vision-Language Model for Target-Oriented Grasping Xinyu Chen Jian Yang Zonghan He Sascha Rank Qi Zhao Yuhui Shi 47 3 0 28 Sep 2023
MHG-GNN: Combination of Molecular Hypergraph Grammar with Graph Neural Network Akihiro Kishimoto Hiroshi Kajino Masataka Hirose Junta Fuchiwaki Indra Priyadarsini Lisa Hamada Hajime Shinohara D. Nakano Seiji Takeda AI4CE 44 4 0 28 Sep 2023
Human Feedback is not Gold Standard Tom Hosking Phil Blunsom Max Bartolo ALM 37 50 0 28 Sep 2023
LawBench: Benchmarking Legal Knowledge of Large Language Models Zhiwei Fei Xiaoyu Shen D. Zhu Fengzhe Zhou Zhuo Han Songyang Zhang Kai-xiang Chen Zongwen Shen Jidong Ge ELM AILaw 41 37 0 28 Sep 2023
Beyond Reverse KL: Generalizing Direct Preference Optimization with Diverse Divergence Constraints Chaoqi Wang Yibo Jiang Yuguang Yang Han Liu Yuxin Chen 42 82 0 28 Sep 2023
Attention Sorting Combats Recency Bias In Long Context Language Models A. Peysakhovich Adam Lerer LRM RALM 54 43 0 28 Sep 2023
AE-GPT: Using Large Language Models to Extract Adverse Events from Surveillance Reports-A Use Case with Influenza Vaccine Adverse Events Yiming Li Xiaodong Lin Jianping He Cui Tao LM&MA 34 25 0 28 Sep 2023
Forgetting Private Textual Sequences in Language Models via Leave-One-Out Ensemble Zhe Liu Ozlem Kalinli MU KELM 32 2 0 28 Sep 2023
AnyMAL: An Efficient and Scalable Any-Modality Augmented Language Model Avamarie Brueggeman Andrea Madotto Zhaojiang Lin Tushar Nagarajan Matt Smith ... Peyman Heidari Yue Liu Kavya Srinet Babak Damavandi Anuj Kumar MLLM 39 93 0 27 Sep 2023
Effective Long-Context Scaling of Foundation Models Wenhan Xiong Jingyu Liu Igor Molybog Hejia Zhang Prajjwal Bhargava ... Dániel Baráth Sergey Edunov Mike Lewis Sinong Wang Hao Ma 42 208 0 27 Sep 2023
LGMCTS: Language-Guided Monte-Carlo Tree Search for Executable Semantic Object Rearrangement Haonan Chang D. K. Bukovšek T. Kosir Alex Lee Blaz Mojskerc Harish Udhaya Kumar M. Omladič Abdeslam Boularias LM&Ro 31 11 0 27 Sep 2023
Where Are We So Far? Understanding Data Storytelling Tools from the Perspective of Human-AI Collaboration Haotian Li Yun Wang Huamin Qu 45 38 0 27 Sep 2023
Identifying and Mitigating Privacy Risks Stemming from Language Models: A Survey Victoria Smith Ali Shahin Shamsabadi Carolyn Ashurst Adrian Weller PILM 39 24 0 27 Sep 2023
Conversational Feedback in Scripted versus Spontaneous Dialogues: A Comparative Analysis Ildikó Pilán Laurent Prévot Hendrik Buschmeier Pierre Lison 26 8 0 27 Sep 2023
NLPBench: Evaluating Large Language Models on Solving NLP Problems Linxin Song Jieyu Zhang Lechao Cheng Pengyuan Zhou Dinesh Manocha Irene Z Li ELM LM&MA LRM 36 10 0 27 Sep 2023
Tackling VQA with Pretrained Foundation Models without Further Training Alvin De Jun Tan Bingquan Shen MLLM 39 1 0 27 Sep 2023