Title
LIFBench: Evaluating the Instruction Following Performance and Stability of Large Language Models in Long-Context Scenarios Xiaodong Wu Minhao Wang Yichen Liu Xiaoming Shi He Yan Xiangju Lu Junmin Zhu Wei Zhang 472 4 0 11 Nov 2024
ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis Zanlin Ni Yulin Wang Renping Zhou Yizeng Han Jiayi Guo Zhiyuan Liu Yuan Yao Gao Huang 107 5 0 11 Nov 2024
Safe Planner: Empowering Safety Awareness in Large Pre-Trained Models for Robot Task Planning Siyuan Li Zhe Ma Feifan Liu Jiani Lu Qinqin Xiao K. Sun Lingfei Cui Xirui Yang P. Liu Xun Wang 95 5 0 11 Nov 2024
What Should Baby Models Read? Exploring Sample-Efficient Data Composition on Model Performance Hong Meng Yam Nathan J Paek 122 1 0 11 Nov 2024
Over-parameterized Student Model via Tensor Decomposition Boosted Knowledge Distillation Yu-Liang Zhan Zhong-Yi Lu Hao Sun Ze-Feng Gao 92 0 0 10 Nov 2024
Towards Low-Resource Harmful Meme Detection with LMM Agents Jianzhao Huang Hongzhan Lin Ziyan Liu Ziyang Luo Guang Chen Jing Ma 80 6 0 08 Nov 2024
Scaling Laws for Precision Tanishq Kumar Zachary Ankner Benjamin Spector Blake Bordelon Niklas Muennighoff Mansheej Paul Cengiz Pehlevan Christopher Ré Aditi Raghunathan AIFin MoMe 115 29 0 07 Nov 2024
CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models Jierui Li Hung Le Yingbo Zhou Caiming Xiong Silvio Savarese Doyen Sahoo LLMAG 95 8 0 07 Nov 2024
Prompt-Guided Internal States for Hallucination Detection of Large Language Models Fujie Zhang Peiqi Yu Biao Yi Baolei Zhang Tong Li Zheli Liu HILM LRM 149 0 0 07 Nov 2024
OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models Siming Huang Tianhao Cheng J.K. Liu Jiaran Hao L. Song ... Ge Zhang Zili Wang Yuan Qi Yinghui Xu Wei Chu ALM 231 31 0 07 Nov 2024
PhDGPT: Introducing a psychometric and linguistic dataset about how large language models perceive graduate students and professors in psychology Edoardo Sebastiano De Duro Enrique Taietta Riccardo Improta Massimo Stella AI4CE 102 0 0 06 Nov 2024
Fine-Grained Guidance for Retrievers: Leveraging LLMs' Feedback in Retrieval-Augmented Generation Yuhang Liu Xueyu Hu Shengyu Zhang Jingyuan Chen Fan Wu Leilei Gan RALM 42 0 0 06 Nov 2024
Evaluation data contamination in LLMs: how do we measure it and (when) does it matter? Aaditya K. Singh Muhammed Yusuf Kocyigit Andrew Poulton David Esiobu Maria Lomeli Gergely Szilvasy Dieuwke Hupkes 82 13 0 06 Nov 2024
No Culture Left Behind: ArtELingo-28, a Benchmark of WikiArt with Captions in 28 Languages Youssef Mohamed Runjia Li Ibrahim Said Ahmad Kilichbek Haydarov Philip Torr Kenneth Church Mohamed Elhoseiny VLM 99 11 0 06 Nov 2024
The Future of Intelligent Healthcare: A Systematic Analysis and Discussion on the Integration and Impact of Robots Using Large Language Models for Healthcare Souren Pashangpour Goldie Nejat LM&MA 98 9 0 05 Nov 2024
Membership Inference Attacks against Large Vision-Language Models Zhan Li Yongtao Wu Yihang Chen F. Tonin Elias Abad Rocamora Volkan Cevher 84 9 0 05 Nov 2024
Mixtures of In-Context Learners Giwon Hong Emile van Krieken Edoardo Ponti Nikolay Malkin Pasquale Minervini 73 1 0 05 Nov 2024
V-DPO: Mitigating Hallucination in Large Vision Language Models via Vision-Guided Direct Preference Optimization Yuxi Xie Guanzhen Li Xiao Xu Min-Yen Kan MLLM VLM 112 24 0 05 Nov 2024
Multi-Transmotion: Pre-trained Model for Human Motion Prediction Yang Gao Po-Chien Luan Alexandre Alahi 65 10 0 04 Nov 2024
A Comparative Analysis of Instruction Fine-Tuning LLMs for Financial Text Classification Sorouralsadat Fatemi Yuheng Hu Maryam Mousavi 107 4 0 04 Nov 2024
Shortcut Learning in In-Context Learning: A Survey Rui Song Yingji Li Fausto Giunchiglia Fausto Giunchiglia Hao Xu 137 3 0 04 Nov 2024
KptLLM: Unveiling the Power of Large Language Model for Keypoint Comprehension Jie Yang Wang Zeng Sheng Jin Lumin Xu Wentao Liu Chen Qian Ruimao Zhang MLLM 133 3 0 04 Nov 2024
Context Parallelism for Scalable Million-Token Inference Amy Yang Jingyi Yang Aya Ibrahim Xinfeng Xie Bangsheng Tang Grigory Sizov Jeremy Reizenstein Jongsoo Park Jianyu Huang MoE LRM 181 7 0 04 Nov 2024
Minder: Faulty Machine Detection for Large-scale Distributed Model Training Yangtao Deng Xiang Shi Zhuo Jiang Xinyu Zhang Lei Zhang ... Fuliang Li Shuguang Wang H. Lin Jianxi Ye Minlan Yu LRM 430 4 0 04 Nov 2024
Efficient Deep Learning Infrastructures for Embedded Computing Systems: A Comprehensive Survey and Future Envision Xiangzhong Luo Di Liu Hao Kong Shuo Huai Hui Chen Guochu Xiong Weichen Liu 69 6 0 03 Nov 2024
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models Aliyah R. Hsu James Zhu Zhichao Wang Bin Bi Shubham Mehrotra ... Sougata Chaudhuri Regunathan Radhakrishnan S. Asur Claire Na Cheng Bin Yu ALM LRM 190 0 0 03 Nov 2024
Randomized Autoregressive Visual Generation Qihang Yu Ju He XueQing Deng Xiaohui Shen Liang-Chieh Chen VGen DiffM 151 40 1 01 Nov 2024
Multi-expert Prompting Improves Reliability, Safety, and Usefulness of Large Language Models Do Xuan Long Duong Ngoc Yen Anh Tuan Luu Kenji Kawaguchi Min-Yen Kan Nancy F. Chen KELM ELM LRM 121 7 0 01 Nov 2024
SimpleFSDP: Simpler Fully Sharded Data Parallel with torch.compile Ruisi Zhang Tianyu Liu Will Feng Andrew Gu Sanket Purandare Wanchao Liang Francisco Massa 127 1 0 01 Nov 2024
Comparison-based Active Preference Learning for Multi-dimensional Personalization Minhyeon Oh Seungjoon Lee Jungseul Ok 72 1 0 01 Nov 2024
Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments Paulius Rauba Nabeel Seedat Krzysztof Kacprzyk Mihaela van der Schaar AI4CE 109 2 0 31 Oct 2024
P-Masking: Power Law Masking Improves Multi-attribute Controlled Generation Mohamed Elgaar Hadi Amiri AI4CE 76 0 0 31 Oct 2024
Matchmaker: Self-Improving Large Language Model Programs for Schema Matching Nabeel Seedat Mihaela van der Schaar 69 3 0 31 Oct 2024
The Potential of LLMs in Medical Education: Generating Questions and Answers for Qualification Exams Yunqi Zhu Wen Tang Ying Sun Xuebing Yang Liyang Dou Yifan Gu Yuanyuan Wu Wensheng Zhang Ying Sun Xuebing Yang LM&MA ELM 178 1 0 31 Oct 2024
FRoundation: Are Foundation Models Ready for Face Recognition? Tahar Chettaoui Naser Damer Fadi Boutros CVBM 113 8 0 31 Oct 2024
DetectRL: Benchmarking LLM-Generated Text Detection in Real-World Scenarios Junchao Wu Runzhe Zhan Derek F. Wong Shu Yang Xinyi Yang Yulin Yuan Lidia S. Chao DeLMO 204 2 0 31 Oct 2024
Tiny Transformers Excel at Sentence Compression Peter Belcak Roger Wattenhofer 61 1 0 30 Oct 2024
EMMA: End-to-End Multimodal Model for Autonomous Driving Jyh-Jing Hwang Runsheng Xu Hubert Lin Wei-Chih Hung Jingwei Ji ... Benjamin Sapp Yin Zhou James Guo Dragomir Anguelov Mingxing Tan VLM LM&Ro 116 38 0 30 Oct 2024
$100K or 100 Days: Trade-offs when Pre-Training with Academic Resources$ Apoorv Khandelwal Tian Yun Nihal V. Nayak Jack Merullo Stephen H. Bach Chen Sun Ellie Pavlick VLM AI4CE OnRL 111 2 0 30 Oct 2024
PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures Tianxiang Wu Minxin Nie Ziqiang Cao MLLM 57 0 0 30 Oct 2024
Enhancing Adversarial Attacks through Chain of Thought Jingbo Su LRM 34 3 0 29 Oct 2024
A Hierarchical Language Model For Interpretable Graph Reasoning Sambhav Khurana Xiner Li Shurui Gui Shuiwang Ji LRM 130 0 0 29 Oct 2024
Revisiting Reliability in Large-Scale Machine Learning Research Clusters Apostolos Kokolis Michael Kuchnik John Hoffman Adithya Kumar Parth Malani Faye Ma Zachary DeVito Siyang Song Kalyan Saladi Carole-Jean Wu 332 9 0 29 Oct 2024
Online Detection of LLM-Generated Texts via Sequential Hypothesis Testing by Betting Can Chen Jun-Kun Wang DeLMO 185 0 0 29 Oct 2024
AutoGLM: Autonomous Foundation Agents for GUIs Xiao Liu Bo Qin Dongzhu Liang Guang Dong Hanyu Lai ... Yujia Wang Yongjun Xu Zehan Qi Yuxiao Dong Jie Tang LLMAG 120 23 0 28 Oct 2024
Exploring the Reliability of Foundation Model-Based Frontier Selection in Zero-Shot Object Goal Navigation Shuaihang Yuan Halil Utku Unlu Hao Huang Congcong Wen Anthony Tzes Yi Fang 65 1 0 28 Oct 2024
DeTeCtive: Detecting AI-generated Text via Multi-Level Contrastive Learning Xun Guo Shan Zhang Yongxin He Ting Zhang Wanquan Feng Haibin Huang Chongyang Ma DeLMO 93 10 0 28 Oct 2024
Matryoshka: Learning to Drive Black-Box LLMs with LLMs Changhao Li Yuchen Zhuang Rushi Qiang Haotian Sun H. Dai Chao Zhang Bo Dai LRM 50 6 0 28 Oct 2024
Energy-Based Diffusion Language Models for Text Generation Minkai Xu Tomas Geffner Karsten Kreis Weili Nie Yilun Xu J. Leskovec Stefano Ermon Arash Vahdat DiffM 122 19 0 28 Oct 2024
Beyond Autoregression: Fast LLMs via Self-Distillation Through Time Justin Deschenaux Çağlar Gülçehre 131 5 0 28 Oct 2024