Title
MIRAGE: Multimodal Immersive Reasoning and Guided Exploration for Red-Team Jailbreak Attacks Wenhao You Bryan Hooi Yiwei Wang Yansen Wang Zong Ke Ming Yang Zi Huang Yujun Cai AAML 100 0 0 24 Mar 2025
A Survey of Large Language Model Agents for Question Answering Murong Yue LLMAG LM&MA ELM 118 5 0 24 Mar 2025
Latent Embedding Adaptation for Human Preference Alignment in Diffusion Planners Wen Zheng Terence Ng Jianda Chen Yuan Xu Tianwei Zhang 115 0 0 24 Mar 2025
CoMP: Continual Multimodal Pre-training for Vision Foundation Models Yuxiao Chen L. Meng Wujian Peng Zuxuan Wu Yu-Gang Jiang VLM 213 1 0 24 Mar 2025
InPO: Inversion Preference Optimization with Reparametrized DDIM for Efficient Diffusion Model Alignment Yaojie Lu Qichao Wang H. Cao Xierui Wang Xiaoyin Xu Min Zhang 122 1 0 24 Mar 2025
LLM Benchmarking with LLaMA2: Evaluating Code Development Performance Across Multiple Programming Languages Patrick Diehl Nojoud Nader Maxim Moraru Steven R. Brandt 101 1 0 24 Mar 2025
Evolutionary Policy Optimization Jianren Wang Yifan Su Abhinav Gupta Deepak Pathak 86 0 0 24 Mar 2025
Fundamental Safety-Capability Trade-offs in Fine-tuning Large Language Models Pin-Yu Chen Han Shen Payel Das Tianyi Chen 100 4 0 24 Mar 2025
Trade-offs in Large Reasoning Models: An Empirical Analysis of Deliberative and Adaptive Reasoning over Foundational Capabilities Weixiang Zhao Xingyu Sui Jiahe Guo Yulin Hu Yang Deng Yanyan Zhao Bing Qin Wanxiang Che Tat-Seng Chua Ting Liu ELM LRM 132 9 0 23 Mar 2025
Vision-R1: Evolving Human-Free Alignment in Large Vision-Language Models via Vision-Guided Reinforcement Learning Yufei Zhan Yousong Zhu Shurong Zheng Hongyin Zhao Fan Yang Ming Tang Jinqiao Wang VLM 123 19 0 23 Mar 2025
Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization Zefeng Zhang Hengzhu Tang Shuaiyi Nie Zhenyu Zhang Yiming Ren Zhenyang Li Dawei Yin Duohe Ma Tingwen Liu 122 1 0 23 Mar 2025
Towards Transformer-Based Aligned Generation with Self-Coherence Guidance Shulei Wang Wang Lin Hai Huang Hanting Wang Sihang Cai ... Tao Jin Jingyuan Chen Jiacheng Sun Jieming Zhu Zhou Zhao DiffM 128 3 0 22 Mar 2025
Enhancing Persona Consistency for LLMs' Role-Playing using Persona-Aware Contrastive Learning Ke Ji Yixin Lian Linxu Li Jingsheng Gao Weiyuan Li Bin Dai 81 2 0 22 Mar 2025
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation Oucheng Huang Yuhang Ma Zeng Zhao Mingrui Wu Jiayi Ji Rongsheng Zhang Zhibo Hu Xiaoshuai Sun Rongrong Ji 80 1 0 22 Mar 2025
Every Sample Matters: Leveraging Mixture-of-Experts and High-Quality Data for Efficient and Accurate Code LLM Codefuse Ling Team Wenting Cai Yuchen Cao Cai Chen ... Wei Zhang Zhenru Zhang Hailin Zhao Xunjin Zheng Jun Zhou ALM MoE 107 1 0 22 Mar 2025
Understanding Inverse Reinforcement Learning under Overparameterization: Non-Asymptotic Analysis and Global Optimality Ruijia Zhang Siliang Zeng Chenliang Li Alfredo García Mingyi Hong 118 0 0 22 Mar 2025
Modifying Large Language Model Post-Training for Diverse Creative Writing John Joon Young Chung Vishakh Padmakumar Melissa Roemmele Yuqian Sun Max Kreminski MoMe 79 2 0 21 Mar 2025
When Preferences Diverge: Aligning Diffusion Models with Minority-Aware Adaptive DPO Lefei Zhang Chen Liu C. Xu Kai Hu Donghao Luo Chengjie Wang Yanwei Fu Yuan Yao 82 0 0 21 Mar 2025
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications Jian Guan Jian Wu Jia-Nan Li Chuanqi Cheng Wei Wu LM&MA 181 3 0 21 Mar 2025
Dancing with Critiques: Enhancing LLM Reasoning with Stepwise Natural Language Self-Critique Yuezun Li Jiahao Xu Tian Liang Xingyu Chen Zhiwei He ... Rui Wang Zizhuo Zhang Zhaopeng Tu Haitao Mi Dong Yu LRM 87 3 0 21 Mar 2025
HAPI: A Model for Learning Robot Facial Expressions from Human Preferences Dongsheng Yang Qianying Liu Wataru Sato Takashi Minato Chaoran Liu Shin’ya Nishida 63 0 0 21 Mar 2025
CoKe: Customizable Fine-Grained Story Evaluation via Chain-of-Keyword Rationalization Brihi Joshi Sriram Venkatapathy Mohit Bansal Nanyun Peng Haw-Shiuan Chang LRM 131 0 0 21 Mar 2025
SafeMERGE: Preserving Safety Alignment in Fine-Tuned Large Language Models via Selective Layer-Wise Model Merging Aladin Djuhera S. Kadhe Farhan Ahmed Syed Zawad Holger Boche MoMe 95 4 0 21 Mar 2025
Offline Model-Based Optimization: Comprehensive Review Minsu Kim Jiayao Gu Ye Yuan Taeyoung Yun Ziqiang Liu Yoshua Bengio Can Chen OffRL 123 4 0 21 Mar 2025
Tuning LLMs by RAG Principles: Towards LLM-native Memory Jiale Wei Shuchi Wu Ruochen Liu Xiang Ying Jingbo Shang Fangbo Tao RALM 104 0 0 20 Mar 2025
Video-VoT-R1: An efficient video inference model integrating image packing and AoE architecture Cheng Li Jiexiong Liu Yixuan Chen Yanqin Jia MLLM VLM 125 1 0 20 Mar 2025
The Lighthouse of Language: Enhancing LLM Agents via Critique-Guided Improvement Ruihan Yang Fanghua Ye Jian Li Siyu Yuan Yikai Zhang Zhaopeng Tu Xiaolong Li Deqing Yang LLMAG 243 5 0 20 Mar 2025
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs Tsunehiko Tanaka Edgar Simo-Serra 117 1 0 20 Mar 2025
UMIT: Unifying Medical Imaging Tasks via Vision-Language Models Haiyang Yu Siyang Yi Ke Niu Minghan Zhuo Bin Li LM&MA 87 4 0 20 Mar 2025
GreenIQ: A Deep Search Platform for Comprehensive Carbon Market Analysis and Automated Report Generation Bisola Faith Kayode Akinyemi Sadeeq Akintola Oluwole Fagbohun Egonna Anaesiuba-Bristol Onyekachukwu Ojumah ... Aniema Inyang Teslim Kazeem Habeeb Alli Udodirim Ibem Offia Prisca Chinazor Amajuoyi 69 0 0 20 Mar 2025
Cultural Alignment in Large Language Models Using Soft Prompt Tuning Reem I. Masoud Martin Ferianc Philip C. Treleaven Miguel R. D. Rodrigues ALM 82 2 0 20 Mar 2025
A Review on Large Language Models for Visual Analytics Navya Sonal Agarwal Sanjay Kumar Sonbhadra 114 0 0 19 Mar 2025
EmpathyAgent: Can Embodied Agents Conduct Empathetic Actions? Xinyan Chen Jiaxin Ge Hongming Dai Qiang Zhou Qiuxuan Feng Jingtong Hu Yun Wang Jiaming Liu Shanghang Zhang LM&Ro 97 0 0 19 Mar 2025
SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks Yifei Zhou Song Jiang Yuandong Tian Jason Weston Sergey Levine Sainbayar Sukhbaatar Xian Li LLMAG LRM 154 15 0 19 Mar 2025
Forensics-Bench: A Comprehensive Forgery Detection Benchmark Suite for Large Vision Language Models Jin Wang Chenghui Lv Xian Li Shichao Dong Huadong Li Kelu Yao Chao Li Wenqi Shao Ping Luo 157 1 0 19 Mar 2025
From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment Jia-Nan Li Jian Guan Songhao Wu Wei Wu Rui Yan 175 3 0 19 Mar 2025
UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction Shravan Nayak Xiangru Jian Kevin Qinghong Lin Juan A. Rodriguez Montek Kalsi ... David Vazquez Christopher Pal Perouz Taslakian Spandana Gella Sai Rajeswar 513 4 0 19 Mar 2025
DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning R. Zhao Junliang Ye Ziyi Wang Guangce Liu Yiwen Chen Yikai Wang Jun Zhu AI4CE 97 4 0 19 Mar 2025
R $^2$ : A LLM Based Novel-to-Screenplay Generation Framework with Causal Plot Graphs Zefeng Lin Yi Xiao Zhiqiang Mo Qifan Zhang Jinqiao Wang ... Jiajing Zhang Huatian Zhang Zhengyi Liu Xianyong Fang Xiaohua Xu 82 0 0 19 Mar 2025
Aligning Crowd-sourced Human Feedback for Reinforcement Learning on Code Generation by Large Language Models M. Wong C. Tan ALM 127 6 0 19 Mar 2025
Exploring Model Editing for LLM-based Aspect-Based Sentiment Classification Shichen Li Zhongqing Wang Zheyu Zhao Yue Zhang Peifeng Li KELM 68 1 0 19 Mar 2025
Exploring Large Language Models for Word Games:Who is the Spy? Chentian Wei Jiewei Chen Jinzhu Xu LLMAG LRM 129 1 0 19 Mar 2025
ExDDV: A New Dataset for Explainable Deepfake Detection in Video Vlad Hondru Eduard Hogea Darian M. Onchis Radu Tudor Ionescu 151 2 0 18 Mar 2025
Navigating Rifts in Human-LLM Grounding: Study and Benchmark Omar Shaikh Hussein Mozannar Gagan Bansal Adam Fourney Eric Horvitz 123 2 0 18 Mar 2025
How much do LLMs learn from negative examples? Shadi S. Hamdan Deniz Yuret 72 0 0 18 Mar 2025
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models Yuxiang Lai Shitian Zhao Ming Li Jike Zhong Xiaofeng Yang OffRL LRM LM&MA VLM 193 31 0 18 Mar 2025
Command R7B Arabic: A Small, Enterprise Focused, Multilingual, and Culturally Aware Arabic LLM Yazeed Alnumay Alexandre Barbet Anna Bialas William Darling Shaan Desai ... Stephanie Howe Olivia Lasche Justin Lee Anirudh Shrinivason Jennifer Tracey 126 0 0 18 Mar 2025
Theoretical Foundation of Flow-Based Time Series Generation: Provable Approximation, Generalization, and Efficiency Jiangxuan Long Zhao Song Chiwun Yang AI4TS 486 0 0 18 Mar 2025
DAPO: An Open-Source LLM Reinforcement Learning System at Scale Qiying Yu Zheng Zhang Ruofei Zhu Yufeng Yuan Xiaochen Zuo ... Ya Zhang Lin Yan Mu Qiao Yonghui Wu Mingxuan Wang OffRL LRM 251 217 0 18 Mar 2025
HiDe-LLaVA: Hierarchical Decoupling for Continual Instruction Tuning of Multimodal Large Language Model Haiyang Guo Fanhu Zeng Ziwei Xiang Fei Zhu Da-Han Wang Xu-Yao Zhang Cheng-Lin Liu 123 3 0 17 Mar 2025