Title
Evaluation of Instruction-Following Ability for Large Language Models on Story-Ending Generation Rem Hida Junki Ohmura Toshiyuki Sekiya ELM 66 0 0 24 Jun 2024
AnnotatedTables: A Large Tabular Dataset with Language Model Annotations Yaojie Hu Ilias Fountalis Jin Tian N. Vasiloglou LMTD 77 5 0 24 Jun 2024
VideoHallucer: Evaluating Intrinsic and Extrinsic Hallucinations in Large Video-Language Models Yuxuan Wang Yueqian Wang Dongyan Zhao Cihang Xie Zilong Zheng MLLM VLM 100 31 0 24 Jun 2024
Retrieval-Augmented Mixture of LoRA Experts for Uploadable Machine Learning Ziyu Zhao Leilei Gan Guoyin Wang Yuwei Hu Tao Shen Hongxia Yang Kun Kuang Fei Wu MoE MoMe 87 12 0 24 Jun 2024
Does Cross-Cultural Alignment Change the Commonsense Morality of Language Models? Yuu Jinnai 104 5 0 24 Jun 2024
Anomaly Detection of Tabular Data Using LLMs Aodong Li Yunhan Zhao Chen Qiu Marius Kloft Padhraic Smyth Maja R. Rudolph Stephan Mandt 116 9 0 24 Jun 2024
MEReQ: Max-Ent Residual-Q Inverse RL for Sample-Efficient Alignment from Intervention Yuxin Chen Chen Tang Chenran Li Ran Tian Peter Stone Masayoshi Tomizuka Wei Zhan 62 1 0 24 Jun 2024
Cascade Reward Sampling for Efficient Decoding-Time Alignment Bolian Li Yifan Wang A. Grama Ruqi Zhang Ruqi Zhang AI4TS 153 15 0 24 Jun 2024
Large Language Models Assume People are More Rational than We Really are Ryan Liu Jiayi Geng Joshua C. Peterson Ilia Sucholutsky Thomas Griffiths 164 20 0 24 Jun 2024
Statistical ranking with dynamic covariates Pinjun Dong Ruijian Han Binyan Jiang Yiming Xu 114 0 0 24 Jun 2024
DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation Yuang Peng Yuxin Cui Haomiao Tang Zekun Qi Runpei Dong Jing Bai Chunrui Han Zheng Ge Xiangyu Zhang Shu-Tao Xia EGVM 194 39 0 24 Jun 2024
Preference Tuning For Toxicity Mitigation Generalizes Across Languages Xiaochen Li Zheng-Xin Yong Stephen H. Bach CLL 98 18 0 23 Jun 2024
INDICT: Code Generation with Internal Dialogues of Critiques for Both Security and Helpfulness Hung Le Yingbo Zhou Caiming Xiong Silvio Savarese Doyen Sahoo 126 3 0 23 Jun 2024
FastMem: Fast Memorization of Prompt Improves Context Awareness of Large Language Models Junyi Zhu Shuochen Liu Yu Yu Bo Tang Yibo Yan Zhiyu Li Feiyu Xiong Tong Xu Matthew B. Blaschko 91 5 0 23 Jun 2024
Can LLM Graph Reasoning Generalize beyond Pattern Memorization? Yizhuo Zhang Heng Wang Shangbin Feng Zhaoxuan Tan Xiaochuang Han Tianxing He Yulia Tsvetkov LRM 98 22 0 23 Jun 2024
PORT: Preference Optimization on Reasoning Traces Salem Lahlou Abdalgader Abubaker Hakim Hacid LRM 122 5 0 23 Jun 2024
Uncovering Hidden Intentions: Exploring Prompt Recovery for Deeper Insights into Generated Texts Louis Give Timo Zaoral Maria Antonietta Bruno 52 1 0 22 Jun 2024
Understanding the Role of User Profile in the Personalization of Large Language Models Bin Wu Zhengyan Shi Hossein A. Rahmani Varsha Ramineni Emine Yilmaz 108 5 0 22 Jun 2024
DABL: Detecting Semantic Anomalies in Business Processes Using Large Language Models Wei Guan Jian Cao Jianqi Gao Haiyan Zhao Shiyou Qian 83 5 0 22 Jun 2024
MR-MLLM: Mutual Reinforcement of Multimodal Comprehension and Vision Perception Guanqun Wang Xinyu Wei Jiaming Liu Ray Zhang Yichi Zhang Kevin Zhang Maurice Chong Shanghang Zhang VLM LRM 62 0 0 22 Jun 2024
Unveiling and Harnessing Hidden Attention Sinks: Enhancing Large Language Models without Training through Attention Calibration Zhongzhi Yu Zheng Wang Yonggan Fu Huihong Shi Khalid Shaikh Yingyan Celine Lin 118 25 0 22 Jun 2024
video-SALMONN: Speech-Enhanced Audio-Visual Large Language Models Guangzhi Sun Wenyi Yu Changli Tang Xianzhao Chen Tian Tan Wei Li Lu Lu Zejun Ma Yuxuan Wang Chao Zhang 97 35 0 22 Jun 2024
Teaching LLMs to Abstain across Languages via Multilingual Feedback Shangbin Feng Weijia Shi Yike Wang Wenxuan Ding Orevaoghene Ahia Shuyue Stella Li Vidhisha Balachandran Sunayana Sitaram Yulia Tsvetkov 161 8 0 22 Jun 2024
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions Terry Yue Zhuo Minh Chien Vu Jenny Chim Han Hu Wenhao Yu ... David Lo Daniel Fried Xiaoning Du H. D. Vries Leandro von Werra 249 193 0 22 Jun 2024
DEM: Distribution Edited Model for Training with Mixed Data Distributions Dhananjay Ram Aditya Rawal Momchil Hardalov Nikolaos Pappas Sheng Zha MoMe 138 2 0 21 Jun 2024
Robust Reinforcement Learning from Corrupted Human Feedback Alexander Bukharin Ilgee Hong Haoming Jiang Zichong Li Qingru Zhang Zixuan Zhang Tuo Zhao 103 8 0 21 Jun 2024
SAIL: Self-Improving Efficient Online Alignment of Large Language Models Mucong Ding Souradip Chakraborty Vibhu Agrawal Zora Che Alec Koppel Mengdi Wang Amrit Singh Bedi Furong Huang 85 13 0 21 Jun 2024
Unsupervised Extraction of Dialogue Policies from Conversations Makesh Narsimhan Sreedhar Traian Rebedea Christopher Parisien OffRL 106 3 0 21 Jun 2024
Hybrid Alignment Training for Large Language Models Chenglong Wang Hang Zhou Kaiyan Chang Bei Li Yongyu Mu Tong Xiao Tongran Liu Jingbo Zhu 109 5 0 21 Jun 2024
A Tale of Trust and Accuracy: Base vs. Instruct LLMs in RAG Systems Florin Cuconasu Giovanni Trappolini Nicola Tonellotto Fabrizio Silvestri 87 2 0 21 Jun 2024
GIEBench: Towards Holistic Evaluation of Group Identity-based Empathy for Large Language Models Leyan Wang Yonggang Jin Tianhao Shen Tianyu Zheng Xinrun Du ... Jiaheng Liu Shi Wang Ge Zhang Liuyu Xiang Zhaofeng He VLM AI4MH 70 0 0 21 Jun 2024
Talking the Talk Does Not Entail Walking the Walk: On the Limits of Large Language Models in Lexical Entailment Recognition C. M. Greco Lucio La Cava Andrea Tagarelli 68 1 0 21 Jun 2024
Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference Anton Xue Avishree Khare Rajeev Alur Surbhi Goel Eric Wong 178 3 0 21 Jun 2024
Detecting AI-Generated Text: Factors Influencing Detectability with Current Methods Kathleen C. Fraser Hillary Dawkins S. Kiritchenko DeLMO 154 13 0 21 Jun 2024
RE-AdaptIR: Improving Information Retrieval through Reverse Engineered Adaptation William Fleshman Benjamin Van Durme 89 0 0 20 Jun 2024
SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions Huitong Pan Qi Zhang Cornelia Caragea Eduard Constantin Dragut Longin Jan Latecki 63 3 0 20 Jun 2024
Factual Dialogue Summarization via Learning from Large Language Models Rongxin Zhu Jey Han Lau Jianzhong Qi HILM 97 3 0 20 Jun 2024
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch Hasan Hammoud Umberto Michieli Fabio Pizzati Philip Torr Adel Bibi Guohao Li Mete Ozay MoMe 73 18 0 20 Jun 2024
Improving Expert Radiology Report Summarization by Prompting Large Language Models with a Layperson Summary Xingmeng Zhao Tongnian Wang Anthony Rios LM&MA 117 2 0 20 Jun 2024
Data-Centric AI in the Age of Large Language Models Xinyi Xu Zhaoxuan Wu Rui Qiao Arun Verma Yao Shu ... Xiaoqiang Lin Wenyang Hu Zhongxiang Dai Pang Wei Koh Bryan Kian Hsiang Low ALM 126 3 0 20 Jun 2024
Rewarding What Matters: Step-by-Step Reinforcement Learning for Task-Oriented Dialogue Huifang Du Shuqin Li Minghao Wu Xuejing Feng Yuan-Fang Li Haofen Wang OffRL 113 2 0 20 Jun 2024
SEC-QA: A Systematic Evaluation Corpus for Financial QA Viet Dac Lai Michael Krumdick Charles Lovering Varshini Reddy Craig W. Schmidt Chris Tanner 98 4 0 20 Jun 2024
IWISDM: Assessing instruction following in multimodal models at scale Xiaoxuan Lei Lucas Gomez Hao Yuan Bai P. Bashivan VLM 119 2 0 20 Jun 2024
The Fire Thief Is Also the Keeper: Balancing Usability and Privacy in Prompts Zhili Shen Zihang Xi Ying He Wei Tong Jingyu Hua Sheng Zhong SILM 86 8 0 20 Jun 2024
Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning Chaojie Wang Yanchen Deng Zhiyi Lyu Liang Zeng Jujie He Shuicheng Yan Bo An LRM ReLM 97 62 0 20 Jun 2024
Learning to Plan for Retrieval-Augmented Large Language Models from Knowledge Graphs Junjie Wang Yin Hua Binbin Hu Dan Yang Ziqi Liu ... Jinjie Gu Jun Zhou Jeff Z. Pan Wen Zhang Huajun Chen RALM 99 16 0 20 Jun 2024
Optimizing Novelty of Top-k Recommendations using Large Language Models and Reinforcement Learning Amit Sharma Hua Li Xue Li Jian Jiao LRM 122 1 0 20 Jun 2024
Finding Safety Neurons in Large Language Models Jianhui Chen Xiaozhi Wang Zijun Yao Yushi Bai Lei Hou Juanzi Li KELM LLMSV 90 18 0 20 Jun 2024
LLM Critics Help Catch Bugs in Mathematics: Towards a Better Mathematical Verifier with Natural Language Feedback Bofei Gao Zefan Cai Runxin Xu Peiyi Wang Ce Zheng ... Chang Zhou Wen Xiao Junjie Hu Tianyu Liu Baobao Chang LRM 113 22 0 20 Jun 2024
Large Language Models are Skeptics: False Negative Problem of Input-conflicting Hallucination Jongyoon Song Sangwon Yu Sungroh Yoon HILM 65 4 0 20 Jun 2024