LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

20 March 2024

Papers citing "LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models"

50 / 246 papers shown

Title
CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning S. Wang L. Zhang Zheren Fu Zhendong Mao 24 0 0 15 May 2025
Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective Yutao Mou Xiao Deng Yuxiao Luo Shikun Zhang Wei Ye ELM 16 0 0 15 May 2025
VTLA: Vision-Tactile-Language-Action Model with Preference Learning for Insertion Manipulation Chaofan Zhang Peng Hao Xiaoge Cao Xiaoshuai Hao Shaowei Cui Shuo Wang 32 0 0 14 May 2025
Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM Nicholas Attolino Alessio Capitanelli Fulvio Mastrogiovanni 34 0 0 13 May 2025
FalseReject: A Resource for Improving Contextual Safety and Mitigating Over-Refusals in LLMs via Structured Reasoning Zhehao Zhang Weijie Xu Fanyou Wu Chandan K. Reddy 29 0 0 12 May 2025
DriveSOTIF: Advancing Perception SOTIF Through Multimodal Large Language Models Shucheng Huang Freda Shi Chen Sun Jiaming Zhong Minghao Ning Yufeng Yang Yukun Lu Hong Wang A. Khajepour 31 0 0 11 May 2025
MonetGPT: Solving Puzzles Enhances MLLMs' Image Retouching Skills Niladri Shekhar Dutt Duygu Ceylan Niloy J. Mitra DiffM 38 0 0 09 May 2025
VideoPath-LLaVA: Pathology Diagnostic Reasoning Through Video Instruction Tuning T. Vuong J. T. Kwak VGen 37 0 0 07 May 2025
Osiris: A Lightweight Open-Source Hallucination Detection System Alex Shan John Bauer Christopher D. Manning HILM VLM 45 0 0 07 May 2025
Think on your Feet: Adaptive Thinking via Reinforcement Learning for Social Agents Minzheng Wang Y. Li Haozhao Wang Xinghua Zhang Nan Xu Bingli Wu Fei Huang Haiyang Yu Wenji Mao LLMAG LRM 43 1 0 04 May 2025
Towards Artificial Intelligence Research Assistant for Expert-Involved Learning Tianyu Liu Simeng Han Xiao Luo Haoyu Wang Pan Lu ... Arman Cohan Hua Xu Mark B. Gerstein James Zou Hongyu Zhao 39 0 0 03 May 2025
An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding Xiuwei Shang Zhenkan Fu Shaoyin Cheng Guoqiang Chen Gangyang Li Li Hu Wenbo Zhang N. Yu 62 0 0 30 Apr 2025
Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models Guanghao Zhou Panjia Qiu Cheng Chen J. Wang Zheming Yang Jian Xu Minghui Qiu OffRL LRM 58 0 0 30 Apr 2025
Beyond One-Size-Fits-All: Inversion Learning for Highly Effective NLG Evaluation Prompts Hanhua Hong Chenghao Xiao Yang Wang Y. Liu Wenge Rong Chenghua Lin 31 0 0 29 Apr 2025
DualRAG: A Dual-Process Approach to Integrate Reasoning and Retrieval for Multi-Hop Question Answering Rong Cheng Jiaheng Liu Yan Zheng Fei Ni Jiazhen Du Hangyu Mao Fuzheng Zhang Bo-Lan Wang Jianye Hao LRM 67 0 0 25 Apr 2025
UrbanPlanBench: A Comprehensive Urban Planning Benchmark for Evaluating Large Language Models Yu Zheng Longyi Liu Yuming Lin Jie Feng Guozhen Zhang Depeng Jin Yong Li ELM 73 0 0 23 Apr 2025
Can Large Language Models Help Multimodal Language Analysis? MMLA: A Comprehensive Benchmark Hanlei Zhang Zhuohang Li Yeshuang Zhu Hua Xu Peiwu Wang Haige Zhu Jie Zhou Jinchao Zhang 39 0 0 23 Apr 2025
Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model Junshu Pan Wei Shen Shulin Huang Qiji Zhou Yue Zhang 71 0 0 22 Apr 2025
Certified Mitigation of Worst-Case LLM Copyright Infringement Jingyu Zhang Jiacan Yu Marc Marone Benjamin Van Durme Daniel Khashabi MoMe 144 0 0 22 Apr 2025
FlowReasoner: Reinforcing Query-Level Meta-Agents Hongcheng Gao Yue Liu Yufei He Longxu Dou C. Du Zhijie Deng Bryan Hooi Min Lin Tianyu Pang AIFin LRM 29 1 0 21 Apr 2025
LongPerceptualThoughts: Distilling System-2 Reasoning for System-1 Perception Yuan-Hong Liao Sven Elflein Liu He Laura Leal-Taixe Yejin Choi Sanja Fidler David Acuna ReLM LRM VLM 129 0 0 21 Apr 2025
SWE-Synth: Synthesizing Verifiable Bug-Fix Data to Enable Large Language Models in Resolving Real-World Bugs Minh V.T. Pham Huy N. Phan Hoang N. Phan Cuong Le Chi T. Nguyen Nghi D. Q. Bui SyDa 29 0 0 20 Apr 2025
MIG: Automatic Data Selection for Instruction Tuning by Maximizing Information Gain in Semantic Space Yicheng Chen Yining Li Kai Hu Zerun Ma Haochen Ye Kai Chen 34 0 0 18 Apr 2025
VLMGuard-R1: Proactive Safety Alignment for VLMs via Reasoning-Driven Prompt Optimization Menglan Chen Xianghe Pang Jingjing Dong Wenhao Wang Yaxin Du Siheng Chen LRM 39 0 0 17 Apr 2025
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training Xiaotian Zhang Yarong Zeng Xinting Huang Hu Hu Runquan Xie Han Hu Zhanhui Kang MLLM VLM 53 0 0 17 Apr 2025
LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard Varun Rao Youran Sun Mahendra Kumar Tejas Mutneja Agastya Mukherjee Haizhao Yang AIFin 36 0 0 17 Apr 2025
Rethinking the Generation of High-Quality CoT Data from the Perspective of LLM-Adaptive Question Difficulty Grading Qianjin Yu Keyu Wu Zihan Chen Chushu Zhang Manlin Mei Lingjun Huang Fang Tan Yongsheng Du Kunlin Liu Yurui Zhu ELM LRM 149 0 0 16 Apr 2025
Video Summarization with Large Language Models Min Jung Lee Dayoung Gong Minsu Cho 26 0 0 15 Apr 2025
RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users Suyu Ye Haojun Shi Darren Shih Hyokun Yun Tanya Roosta Tianmin Shu 24 0 0 14 Apr 2025
Deep Reasoning Translation via Reinforcement Learning Jiaan Wang Fandong Meng Jie Zhou OffRL LRM 33 0 0 14 Apr 2025
Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models? Yanbo Wang Jiyang Guan Jian Liang Ran He 51 0 0 14 Apr 2025
Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning Can Jin Hongwu Peng Qixin Zhang Yujin Tang Dimitris N. Metaxas Tong Che LLMAG LRM 148 2 0 14 Apr 2025
Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems Zaid Khan Elias Stengel-Eskin Archiki Prasad Jaemin Cho Joey Tianyi Zhou 31 0 0 14 Apr 2025
RealSafe-R1: Safety-Aligned DeepSeek-R1 without Compromising Reasoning Capability Y. Zhang Zihao Zeng Dongbai Li Yao Huang Zhijie Deng Yinpeng Dong LRM 35 4 0 14 Apr 2025
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations Ding Chen Qingchen Yu P. Wang W. Zhang Bo Tang Feiyu Xiong X. Li Minchuan Yang Z. Li ALM LRM 36 2 0 14 Apr 2025
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents Run Luo Lu Wang Wanwei He Xiaobo Xia LLMAG 51 6 0 14 Apr 2025
QM-ToT: A Medical Tree of Thoughts Reasoning Framework for Quantized Model Zongxian Yang Jiayu Qian Z. Huang Kay Chen Tan LM&MA LRM 31 0 0 13 Apr 2025
A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis Xin Gao Qizhi Pei Zinan Tang Yongqian Li Honglin Lin Jiang Wu C. He Lijun Wu SyDa 30 0 0 11 Apr 2025
SD $^2$ : Self-Distilled Sparse Drafters Mike Lasby Nish Sinnadurai Valavan Manohararajah Sean Lie Vithursan Thangarasa 143 1 0 10 Apr 2025
CHIME: A Compressive Framework for Holistic Interest Modeling Yong Bai Rui Xiang Kaiyuan Li Yongxiang Tang Yanhua Cheng Xialong Liu Peng Jiang Kun Gai 29 0 0 09 Apr 2025
On the Suitability of Reinforcement Fine-Tuning to Visual Tasks X. Chen Wei Li Chunxu Liu Chi Xie Xiaoyan Hu Chengqian Ma Feng Zhu Rui Zhao ReLM LRM 54 0 0 08 Apr 2025
SEA-LION: Southeast Asian Languages in One Network Raymond Ng Thanh Ngan Nguyen Yuli Huang Ngee Chia Tai Wai Yi Leong ... David Ong Tat-Wee B. Liu William-Chandra Tjhi Erik Cambria Leslie Teo 36 11 0 08 Apr 2025
KnowsLM: A framework for evaluation of small language models for knowledge augmentation and humanised conversations Chitranshu Harbola A. Purwar 37 1 0 06 Apr 2025
Hallucination Detection using Multi-View Attention Features Yuya Ogasa Yuki Arase 26 0 0 06 Apr 2025
Block Toeplitz Sparse Precision Matrix Estimation for Large-Scale Interval-Valued Time Series Forecasting Wan Tian Zhongfeng Qin AI4TS 36 0 0 04 Apr 2025
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay Akshara Prabhakar Ziqiang Liu Weiran Yao Jianguo Zhang Ming Zhu ... Juan Carlos Niebles Shelby Heinecke Hairu Wang Shri Kiran Srinivasan Caiming Xiong VGen 84 2 0 04 Apr 2025
YaleNLP @ PerAnsSumm 2025: Multi-Perspective Integration via Mixture-of-Agents for Enhanced Healthcare QA Summarization Dongsuk Jang Alan Li Arman Cohan 42 0 0 04 Apr 2025
MegaMath: Pushing the Limits of Open Math Corpora Fan Zhou Zengzhi Wang Nikhil Ranjan Zhoujun Cheng Liping Tang Guowei He Zhengzhong Liu Eric P. Xing LRM 51 1 0 03 Apr 2025
LVMed-R2: Perception and Reflection-driven Complex Reasoning for Medical Report Generation Hao Wang Shuchang Ye Jinghao Lin Usman Naseem Jinman Kim LRM 29 0 0 02 Apr 2025
IHC-LLMiner: Automated extraction of tumour immunohistochemical profiles from PubMed abstracts using large language models Yunsoo Kim Michal W. S. Ong Daniel W. Rogalsky Manuel Rodriguez-Justo Honghan Wu Adam P. Levine 38 0 0 01 Apr 2025