Title
Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions Zhaoxian Wu Quan Xian Tayfun Gokmen Omobayode Fagbohungbe Tianyi Chen 172 0 0 17 Feb 2025
SmartLLM: Smart Contract Auditing using Custom Generative AI Jun Kevin Pujianto Yugopuspito 59 0 0 17 Feb 2025
HedgeAgents: A Balanced-aware Multi-agent Financial Trading System Xiangyu Li Yawen Zeng Xiaofen Xing Jin Xu Xiangmin Xu AIFin 189 3 0 17 Feb 2025
BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages Shamsuddeen Hassan Muhammad N. Ousidhoum Idris Abdulmumin Jan Philip Wahle Terry Ruas ... Florian Valentin Wunderlich Hanif Muhammad Zhafran Tianhui Zhang Yi Zhou Saif M. Mohammad 139 10 0 17 Feb 2025
A Survey of Personalized Large Language Models: Progress and Future Directions Jiahong Liu Zexuan Qiu Zhongyang Li Quanyu Dai Jieming Zhu Minda Hu Menglin Yang Irwin King LM&MA 108 9 0 17 Feb 2025
Mimicking the Familiar: Dynamic Command Generation for Information Theft Attacks in LLM Tool-Learning System Ziyou Jiang Mingyang Li Guowei Yang Junjie Wang Yuekai Huang Zhiyuan Chang Qing Wang AAML 78 1 0 17 Feb 2025
Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification Yubo Wang Haoyang Li Fei Teng Lei Chen 184 1 0 17 Feb 2025
Language Models Can See Better: Visual Contrastive Decoding For LLM Multimodal Reasoning Yuqi Pang Bowen Yang Haoqin Tu Yun Cao Zeyu Zhang LRM MLLM 103 0 0 17 Feb 2025
How Compositional Generalization and Creativity Improve as Diffusion Models are Trained Alessandro Favero Antonio Sclocchi Francesco Cagnetta Pascal Frossard Matthieu Wyart DiffM CoGe 114 6 0 17 Feb 2025
Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale Fan Zhou Zengzhi Wang Qian Liu Junlong Li Pengfei Liu ALM 224 15 0 17 Feb 2025
The Graph's Apprentice: Teaching an LLM Low Level Knowledge for Circuit Quality Estimation Reza Moravej Saurabh Bodhe Zhanguang Zhang Didier Chetelat Dimitrios Tsaras Yingxue Zhang Hui-Ling Zhen Jianye Hao Mingxuan Yuan 121 2 0 17 Feb 2025
Small Models Struggle to Learn from Strong Reasoners Yuetai Li Xiang Yue Zhangchen Xu Fengqing Jiang Luyao Niu Bill Yuchen Lin Bhaskar Ramasubramanian Radha Poovendran LRM 128 31 0 17 Feb 2025
SQL-o1: A Self-Reward Heuristic Dynamic Search Method for Text-to-SQL Shuai Lyu Haoran Luo Zhonghong Ou Zhonghong Ou Jiangfeng Sun Yang Qin Xiaoran Shang Meina Song Yifan Zhu AI4TS LRM 154 5 0 17 Feb 2025
Towards Cross-Lingual Explanation of Artwork in Large-scale Vision Language Models Shintaro Ozaki Kazuki Hayashi Yusuke Sakai Hidetaka Kamigaito Katsuhiko Hayashi Taro Watanabe LRM 150 1 0 17 Feb 2025
Associative Recurrent Memory Transformer Ivan Rodkin Yuri Kuratov Aydar Bulatov Andrey Kravchenko 134 4 0 17 Feb 2025
PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent Jiateng Liu Lin Ai Zizhou Liu Payam Karisani Zheng Hui May Fung Preslav Nakov Julia Hirschberg Heng Ji DiffM 167 5 0 17 Feb 2025
A Critical Look At Tokenwise Reward-Guided Text Generation Ahmad Rashid Ruotian Wu Julia Grosse Agustinus Kristiadi Pascal Poupart OffRL 166 0 0 17 Feb 2025
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for Visual Question Answering Zeqing Wang Wentao Wan Qiqing Lao Runmeng Chen Minjie Lang Keze Wang Liang Lin Liang Lin LRM 234 3 0 17 Feb 2025
VRoPE: Rotary Position Embedding for Video Large Language Models Zikang Liu Longteng Guo Yepeng Tang Tongtian Yue Junxian Cai Kai Ma Qingbin Liu Xi Chen Jing Liu 125 1 0 17 Feb 2025
Improving Scientific Document Retrieval with Concept Coverage-based Query Set Generation SeongKu Kang Bowen Jin Wonbin Kweon Yu Zhang Dongha Lee Jiawei Han Hwanjo Yu 114 3 0 16 Feb 2025
JExplore: Design Space Exploration Tool for Nvidia Jetson Boards Basar Kutukcu Sinan Xie Sabur Baidya Sujit Dey 64 0 0 16 Feb 2025
The Rotary Position Embedding May Cause Dimension Inefficiency in Attention Heads for Long-Distance Retrieval Ting-Rui Chiang Dani Yogatama 56 0 0 16 Feb 2025
Soteria: Language-Specific Functional Parameter Steering for Multilingual Safety Alignment Somnath Banerjee Sayan Layek Pratyush Chatterjee Animesh Mukherjee Rima Hazra LLMSV 149 1 0 16 Feb 2025
Phantom: Subject-consistent video generation via cross-modal alignment Lijie Liu Tianxiang Ma Bingchuan Li Zhuowei Chen Jiawei Liu Qian He Xinglong Wu Qian He Xinglong Wu DiffM VGen 189 14 0 16 Feb 2025
How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training Yixin Ou Yunzhi Yao N. Zhang Hui Jin Jiacheng Sun Shumin Deng Zechao Li Ningyu Zhang KELM CLL 128 2 0 16 Feb 2025
Generating Millions Of Lean Theorems With Proofs By Exploring State Transition Graphs David Yin Jing Gao 58 0 0 16 Feb 2025
Primus: A Pioneering Collection of Open-Source Datasets for Cybersecurity LLM Training Yao-Ching Yu Tsun-Han Chiang Cheng-Wei Tsai Chien-Ming Huang Wen-Kwang Tsao 119 7 0 16 Feb 2025
Exposing Numeracy Gaps: A Benchmark to Evaluate Fundamental Numerical Abilities in Large Language Models Haoyang Li Xuejia Chen Zhanchao Xu Darian Li Nicole Hu ... Yongbin Li Luyu Qiu C. Zhang Qing Li Lei Chen ELM LRM 118 1 0 16 Feb 2025
CMCTS: A Constrained Monte Carlo Tree Search Framework for Mathematical Reasoning in Large Language Model Qingwen Lin Boyan Xu Zijian Li Zijian Li Keli Zhang Ruichu Cai Ruichu Cai LRM 111 3 0 16 Feb 2025
Order-agnostic Identifier for Large Language Model-based Generative Recommendation Xinyu Lin Haihan Shi Wenjie Wang Fuli Feng Qifan Wang See-Kiong Ng Tat-Seng Chua 52 3 0 15 Feb 2025
SVBench: A Benchmark with Temporal Multi-Turn Dialogues for Streaming Video Understanding Zhenyu Yang Yihan Hu Zemin Du Dizhan Xue Shengsheng Qian Jiahong Wu Fan Yang W. Dong Changsheng Xu 111 9 0 15 Feb 2025
A Tutorial on LLM Reasoning: Relevant Methods behind ChatGPT o1 Jun Wang LRM KELM 158 8 0 15 Feb 2025
Superpose Singular Features for Model Merging Haiquan Qiu You Wu Quanming Yao MoMe 173 0 0 15 Feb 2025
Man Made Language Models? Evaluating LLMs' Perpetuation of Masculine Generics Bias Enzo Doyen Amalia Todirascu 94 1 0 14 Feb 2025
Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model Guoqing Ma Haoyang Huang K. Yan L. Chen Nan Duan ... Yansen Wang Yuanwei Lu Yu-Cheng Chen Yu-Juan Luo Yihao Luo DiffM VGen 377 41 0 14 Feb 2025
MUDDFormer: Breaking Residual Bottlenecks in Transformers via Multiway Dynamic Dense Connections Da Xiao Qingye Meng Shengping Li Xingyuan Yuan MoE AI4CE 149 1 0 13 Feb 2025
Toward Total Recall: Enhancing FAIRness through AI-Driven Metadata Standardization Sowmya S. Sundaram Rafael S Gonçalves Mark A. Musen 52 0 0 13 Feb 2025
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency Dongzhi Jiang Renrui Zhang Ziyu Guo Yanwei Li Yu Qi ... Shen Yan Bo Zhang Chaoyou Fu Peng Gao Hongsheng Li MLLM LRM 121 38 0 13 Feb 2025
Matina: A Large-Scale 73B Token Persian Text Corpus Sara Bourbour Hosseinbeigi Fatemeh Taherinezhad Heshaam Faili Hamed Baghbani Fatemeh Nadi Mostafa Amiri 166 0 0 13 Feb 2025
Explanation based In-Context Demonstrations Retrieval for Multilingual Grammatical Error Correction Wei Li Wen Luo Guangyue Peng Houfeng Wang 179 0 0 12 Feb 2025
ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification Jiangbo Shi Chen Li Tieliang Gong Yefeng Zheng Huazhu Fu VLM 185 12 0 12 Feb 2025
When More is Less: Understanding Chain-of-Thought Length in LLMs Yuyang Wu Yifei Wang Tianqi Du Stefanie Jegelka Yisen Wang Yisen Wang LRM 158 51 0 11 Feb 2025
JBShield: Defending Large Language Models from Jailbreak Attacks through Activated Concept Analysis and Manipulation Shenyi Zhang Yuchen Zhai Keyan Guo Hongxin Hu Shengnan Guo Zheng Fang Lingchen Zhao Chao Shen Cong Wang Qian Wang AAML 146 4 0 11 Feb 2025
CreAgent: Towards Long-Term Evaluation of Recommender System under Platform-Creator Information Asymmetry Xiaopeng Ye Chen Xu Zhongxiang Sun Jun Xu Gang Wang Zhenhua Dong Ji-Rong Wen 138 0 0 11 Feb 2025
Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification Zicheng Liu Siyuan Li Zhiyuan Chen Lei Xin Fang Wu Chang Yu Qirong Yang Yucheng Guo Yifan Yang Stan Z. Li SyDa AI4CE 207 2 0 11 Feb 2025
UniMoD: Efficient Unified Multimodal Transformers with Mixture-of-Depths Weijia Mao Zhiyong Yang Mike Zheng Shou MoE 202 1 0 10 Feb 2025
Pre-Trained Video Generative Models as World Simulators Haoran He Yang Zhang Liang Lin Zhihao Xu Ling Pan VGen 170 5 0 10 Feb 2025
EfficientLLM: Scalable Pruning-Aware Pretraining for Architecture-Agnostic Edge Language Models Xingrun Xing Zheng Liu Shitao Xiao Boyan Gao Yiming Liang Wanpeng Zhang Haokun Lin Guoqi Li Jiajun Zhang LRM 276 2 0 10 Feb 2025
Do we really have to filter out random noise in pre-training data for language models? Jinghan Ru Yuxin Xie Xianwei Zhuang Yuguo Yin Zhihui Guo Zhiming Liu Qianli Ren Yuexian Zou 193 6 0 10 Feb 2025
Gradient Multi-Normalization for Stateless and Scalable LLM Training M. Scetbon Chao Ma Wenbo Gong Edward Meeds 183 1 0 10 Feb 2025