Title
MetaRuleGPT: Recursive Numerical Reasoning of Language Models Trained with Simple Rules Kejie Chen Lin Wang Qinghai Zhang Renjun Xu ReLM LRM 104 0 0 18 Dec 2024
A Statistical and Multi-Perspective Revisiting of the Membership Inference Attack in Large Language Models Bowen Chen Namgi Han Yusuke Miyao 182 0 0 18 Dec 2024
LLMs are Also Effective Embedding Models: An In-depth Overview Chongyang Tao Tao Shen Shen Gao Junshuo Zhang Zhen Li Zhengwei Tao Shuai Ma 145 11 0 17 Dec 2024
Understanding Emotional Body Expressions via Large Language Models Haifeng Lu Jiuyi Chen Feng Liang Mingkui Tan Runhao Zeng Xiping Hu 122 0 0 17 Dec 2024
QUENCH: Measuring the gap between Indic and Non-Indic Contextual General Reasoning in LLMs Mohammad Aflah Khan Neemesh Yadav Sarah Masud Md. Shad Akhtar 169 0 0 16 Dec 2024
Embodied CoT Distillation From LLM To Off-the-shelf Agents Wonje Choi Woo Kyung Kim Minjong Yoo Honguk Woo OffRL LM&Ro 169 3 0 16 Dec 2024
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models Jiale Cheng Xiao-Chang Liu C. Wang Xiaotao Gu Yaojie Lu Dan Zhang Yuxiao Dong J. Tang Hongning Wang Minlie Huang LRM 189 4 0 16 Dec 2024
LAW: Legal Agentic Workflows for Custody and Fund Services Contracts William Watson Nicole Cho Nishan Srishankar Zhen Zeng Lucas Cecchi Daniel Scott S. Siddagangappa Rachneet Kaur T. Balch Manuela Veloso AILaw 118 0 0 15 Dec 2024
Enhancing Discoverability in Enterprise Conversational Systems with Proactive Question Suggestions Xiaobin Shen Daniel Lee Sumit Ranjan Sai Sree Harsha Pawan Sevak Yunyao Li 174 0 0 14 Dec 2024
Efficient Continual Pre-training of LLMs for Low-resource Languages Arijit Nag Soumen Chakrabarti Animesh Mukherjee Niloy Ganguly 124 1 0 13 Dec 2024
InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions Pan Zhang Xiaoyi Dong Yuhang Cao Yuhang Zang Rui Qian ... Xinsong Zhang Kai Chen Yu Qiao Dahua Lin Jiaqi Wang KELM 203 16 0 12 Dec 2024
TimeRefine: Temporal Grounding with Time Refining Video LLM Xizi Wang Feng Cheng Ziyang Wang Huiyu Wang Md. Mohaiminul Islam Lorenzo Torresani Joey Tianyi Zhou Gedas Bertasius David J. Crandall 214 2 0 12 Dec 2024
Olympus: A Universal Task Router for Computer Vision Tasks Yuanze Lin Yunsheng Li Dongdong Chen Weijian Xu Ronald Clark Philip Torr VLM ObjD 548 1 0 12 Dec 2024
Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs Xiaqiang Tang Jian Li Nan Du Sihong Xie 145 3 0 10 Dec 2024
Bridging Conversational and Collaborative Signals for Conversational Recommendation Ahmad Bin Rabiah Nafis Sadeq Julian McAuley 198 0 0 09 Dec 2024
Taming Sensitive Weights : Noise Perturbation Fine-tuning for Robust LLM Quantization Dongwei Wang Huanrui Yang MQ 184 1 0 08 Dec 2024
Training-Free Bayesianization for Low-Rank Adapters of Large Language Models Haizhou Shi Yibin Wang Ligong Han Huatian Zhang Hao Wang UQCV 243 2 0 07 Dec 2024
DiCoDe: Diffusion-Compressed Deep Tokens for Autoregressive Video Generation with Language Models Yizhuo Li Yuying Ge Yixiao Ge Ping Luo Ying Shan DiffM VGen 189 0 0 05 Dec 2024
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization Runsheng Bai Qiang Liu B. Liu MQ 139 2 0 05 Dec 2024
EgoPlan-Bench2: A Benchmark for Multimodal Large Language Model Planning in Real-World Scenarios Lu Qiu Yuying Ge Yi Chen Yixiao Ge Ying Shan Xihui Liu LLMAG LRM 219 8 0 05 Dec 2024
The Evolution and Future Perspectives of Artificial Intelligence Generated Content Chengzhang Zhu Luobin Cui Ying Tang Jiacun Wang 163 1 0 02 Dec 2024
Towards Adaptive Mechanism Activation in Language Agent Ziyang Huang Jun Zhao Kang Liu LLMAG AI4CE 129 1 0 01 Dec 2024
Needle: A Generative AI-Powered Multi-modal Database for Answering Complex Natural Language Queries Mahdi Erfanian Mohsen Dehghankar Abolfazl Asudeh SyDa MedIm 39 0 0 01 Dec 2024
Unified Parameter-Efficient Unlearning for LLMs Chenlu Ding Jiancan Wu Yancheng Yuan Jinda Lu Kai Zhang Alex Su Xiang Wang Xiangnan He MU KELM 189 8 0 30 Nov 2024
ChineseWebText 2.0: Large-Scale High-quality Chinese Web Text with Multi-dimensional and fine-grained information Wanyue Zhang Ziyong Li Wen Yang Chunlin Leng Yinan Bai Qianlong Du Chengqing Zong Jiajun Zhang 116 0 0 29 Nov 2024
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification Taja Kuzman Nikola Ljubesic 131 0 0 29 Nov 2024
On Domain-Adaptive Post-Training for Multimodal Large Language Models Daixuan Cheng Shaohan Huang Ziyu Zhu Xintong Zhang Wayne Xin Zhao Zhongzhi Luan Bo Dai Zhenliang Zhang VLM 180 5 0 29 Nov 2024
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes Tejaswini Medi Arianna Rampini Pradyumna Reddy P. Jayaraman Margret Keuper DiffM 166 0 0 28 Nov 2024
VLM-HOI: Vision Language Models for Interpretable Human-Object Interaction Analysis Donggoo Kang Dasol Jeong Hyunmin Lee Sangwoo Park Hasil Park Sunkyu Kwon Yeongjoon Kim Joonki Paik MLLM VLM 159 0 0 27 Nov 2024
SoftmAP: Software-Hardware Co-design for Integer-Only Softmax on Associative Processors M. Rakka Jiajian Li Guohao Dai A. Eltawil M. Fouda Fadi J. Kurdahi 129 1 0 26 Nov 2024
SoK: Decentralized AI (DeAI) Zhipeng Wang Rui Sun Elizabeth Lui Vatsal Shah Xihan Xiong Jiahao Sun Davide Crapis William Knottenbelt 203 2 0 26 Nov 2024
PEFTGuard: Detecting Backdoor Attacks Against Parameter-Efficient Fine-Tuning Zhen Sun Tianshuo Cong Yule Liu Chenhao Lin Xinlei He Rongmao Chen Xingshuo Han Xinyi Huang AAML 181 6 0 26 Nov 2024
TransCompressor: LLM-Powered Multimodal Data Compression for Smart Transportation Huanqi Yang Rucheng Wu Weitao Xu 130 6 0 25 Nov 2024
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE Yongwei Chen Yushi Lan Shangchen Zhou Tengfei Wang Xingang Pan 267 6 0 25 Nov 2024
Anda: Unlocking Efficient LLM Inference with a Variable-Length Grouped Activation Data Format Chao Fang Man Shi Robin Geens Arne Symons Zhongfeng Wang Marian Verhelst 154 2 0 24 Nov 2024
AfriMed-QA: A Pan-African, Multi-Specialty, Medical Question-Answering Benchmark Dataset Tobi Olatunji Charles Nimo A. Owodunni Tassallah Abdullahi Emmanuel Ayodele ... Michael Best Irfan Essa Stephen E. Moore Chris Fourie Mercy Nyamewaa Asiedu LM&MA 148 3 0 23 Nov 2024
Towards Robust Evaluation of Unlearning in LLMs via Data Transformations Abhinav Joshi Shaswati Saha Divyaksh Shukla Sriram Vema Harsh Jhamtani Manas Gaur Ashutosh Modi MU 153 5 0 23 Nov 2024
Communication-Efficient Sparsely-Activated Model Training via Sequence Migration and Token Condensation Fahao Chen Peng Li Zicong Hong Zhou Su Song Guo MoMe MoE 128 0 0 23 Nov 2024
UnifiedCrawl: Aggregated Common Crawl for Affordable Adaptation of LLMs on Low-Resource Languages Bethel Melesse Tessema Akhil Kedia Tae-Sun Chung 96 0 0 21 Nov 2024
Planning-Driven Programming: A Large Language Model Programming Workflow Chao Lei Yanchuan Chang Nir Lipovetzky Krista A. Ehinger 214 6 0 21 Nov 2024
Hardware Scaling Trends and Diminishing Returns in Large-Scale Distributed Training Jared Fernandez Luca Wehrstedt Leonid Shamis Mostafa Elhoushi Kalyan Saladi Yonatan Bisk Emma Strubell Jacob Kahn 557 4 0 20 Nov 2024
Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding Nabeel Seedat Caterina Tozzi Andrea Hita Ardiaca Mihaela van der Schaar James Weatherall Adam Taylor 534 0 0 20 Nov 2024
Selective Attention: Enhancing Transformer through Principled Context Control Xuechen Zhang Xiangyu Chang Mingchen Li Amit K. Roy-Chowdhury Jiasi Chen Samet Oymak 131 3 0 19 Nov 2024
Advancing Large Language Models for Spatiotemporal and Semantic Association Mining of Similar Environmental Events Yuanyuan Tian Wenwen Li Lei Hu Xinyu Chen Michael Brook Michael Brubaker Fan Zhang A. Liljedahl KELM 150 2 0 19 Nov 2024
CODECLEANER: Elevating Standards with A Robust Data Contamination Mitigation Toolkit Jialun Cao Songqiang Chen Wuqi Zhang Hau Ching Lo Shing-Chi Cheung 73 1 0 16 Nov 2024
Does Prompt Formatting Have Any Impact on LLM Performance? Jia He Mukund Rungta David Koleczek Arshdeep Sekhon Franklin X Wang Sadid Hasan LLMAG LRM 115 59 0 15 Nov 2024
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference Janghwan Lee Jiwoong Park Jinseok Kim Yongjik Kim Jungju Oh Jinwook Oh Jungwook Choi 80 2 0 15 Nov 2024
Spider: Any-to-Many Multimodal LLM Jinxiang Lai Jie Zhang Jun Liu Jian Li Xiaocheng Lu Song Guo MLLM 197 2 0 14 Nov 2024
Dynamic Rewarding with Prompt Optimization Enables Tuning-free Self-Alignment of Language Models Somanshu Singla Zhen Wang Tianyang Liu Abdullah Ashfaq Zhiting Hu Eric Xing 75 2 0 13 Nov 2024
New Emerged Security and Privacy of Pre-trained Model: a Survey and Outlook Meng Yang Tianqing Zhu Chi Liu Wanlei Zhou Shui Yu Philip S. Yu AAML ELM PILM 112 1 0 12 Nov 2024