Qwen Technical Report

28 September 2023

Jinze Bai

Shuai Bai

Yunfei Chu

Zeyu Cui

Kai Dang

Xiaodong Deng

Yang Fan

Wenbin Ge

Yu Han

Fei Huang

Binyuan Hui

Luo Ji

Mei Li

Junyang Lin

Runji Lin

Dayiheng Liu

Gao Liu

Chengqiang Lu

Keming Lu

Jianxin Ma

Rui Men

Xingzhang Ren

Xuancheng Ren

Chuanqi Tan

Sinan Tan

Jianhong Tu

Peng Wang

Shijie Wang

Wei Wang

Shengguang Wu

Benfeng Xu

Jin Xu

An Yang

Hao Yang

Jian Yang

Shusheng Yang

Yang Yao

Bowen Yu

Hongyi Yuan

Zheng Yuan

Jianwei Zhang

Xinyu Zhang

Yichang Zhang

Zhenru Zhang

Chang Zhou

Jingren Zhou

Xiaohuan Zhou

Tianhang Zhu

OSLM

ArXiv (abs)PDF HTML

Papers citing "Qwen Technical Report"

50 / 1,345 papers shown

Title
GOLLuM: Gaussian Process Optimized LLMs -- Reframing LLM Finetuning through Bayesian Optimization Bojana Ranković P. Schwaller BDL 483 1 0 08 Apr 2025
The Curse of CoT: On the Limitations of Chain-of-Thought in In-Context Learning Tianshi Zheng Yixiang Chen Chengxi Li Chunyang Li Qing Zong Haochen Shi Baixuan Xu Yangqiu Song Ginny Wong Simon See LRM 110 5 0 07 Apr 2025
LEO-MINI: An Efficient Multimodal Large Language Model using Conditional Token Reduction and Mixture of Multi-Modal Experts Yimu Wang Mozhgan Nasr Azadani Sean Sedwards Krzysztof Czarnecki MLLM MoE 88 0 0 07 Apr 2025
Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions He Zhu Quyu Kong Kechun Xu Xunlong Xia Bing Deng Jieping Ye R. Xiong Yansen Wang 70 0 0 07 Apr 2025
On the Robustness of GUI Grounding Models Against Image Attacks Haoren Zhao Tianyi Chen Zhen Wang AAML 120 3 0 07 Apr 2025
Unleashing the Power of LLMs in Dense Retrieval with Query Likelihood Modeling Hengran Zhang Keping Bi Jiafeng Guo Xiaojie Sun Shihao Liu Daiting Shi Dawei Yin Xueqi Cheng RALM 477 0 0 07 Apr 2025
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs Will Cai Tianneng Shi Xuandong Zhao Dawn Song 78 6 0 07 Apr 2025
Revealing the Intrinsic Ethical Vulnerability of Aligned Large Language Models Jiawei Lian Jianhong Pan L. Wang Yi Wang Shaohui Mei Lap-Pui Chau AAML 137 0 0 07 Apr 2025
Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models Ruikang Liu Yuxuan Sun Manyi Zhang Haoli Bai Xianzhi Yu Tiezheng Yu C. Yuan Lu Hou MQ LRM 126 11 0 07 Apr 2025
MedM-VL: What Makes a Good Medical LVLM? Yiming Shi Shaoshuai Yang Xun Zhu Haoyu Wang Miao Li Ji Wu VLM 130 1 0 06 Apr 2025
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding Yang Jiao Haibo Qiu Zequn Jie Tian Jin Jingjing Chen Lin Ma Yu Jiang 106 10 0 06 Apr 2025
Efficient Evaluation of Large Language Models via Collaborative Filtering Xu-Xiang Zhong Chao Yi Han-Jia Ye 118 0 0 05 Apr 2025
Distillation and Refinement of Reasoning in Small Language Models for Document Re-ranking Chris Samarinas Hamed Zamani ALM LRM 172 2 0 04 Apr 2025
UNDO: Understanding Distillation as Optimization Kushal Kumar Jain Piyushi Goyal Kumar Shridhar 91 0 0 03 Apr 2025
How Post-Training Reshapes LLMs: A Mechanistic View on Knowledge, Truthfulness, Refusal, and Confidence Hongzhe Du Weikai Li Min Cai Karim Saraipour Zimin Zhang Himabindu Lakkaraju Yizhou Sun Shichang Zhang KELM 66 1 0 03 Apr 2025
Noiser: Bounded Input Perturbations for Attributing Large Language Models Mohammad Reza Ghasemi Madani Aryo Pradipta Gema Gabriele Sarti Yu Zhao Pasquale Minervini Andrea Passerini AAML 117 1 0 03 Apr 2025
Representation Bending for Large Language Model Safety Ashkan Yousefpour Taeheon Kim Ryan S. Kwon Seungbeen Lee Wonje Jeung Seungju Han Alvin Wan Harrison Ngan Youngjae Yu Jonghyun Choi AAML ALM KELM 129 4 0 02 Apr 2025
Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training Zhijun Wang Jiahuan Li Hao Zhou Rongxiang Weng Jiadong Wang Xin Huang Xue Han Junlan Feng Chao Deng Shujian Huang LRM 106 3 0 02 Apr 2025
LLMs4SchemaDiscovery: A Human-in-the-Loop Workflow for Scientific Schema Mining with Large Language Models Sameer Sadruddin Jennifer D’Souza Eleni Poupaki Alex Watkins Hamed Babaei Giglou Anisa Rula Bora Karasulu Sören Auer Adrie Mackus Erwin Kessels 72 2 0 01 Apr 2025
GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments Enjun Du Miao Hu Tian Jin Zhihan Zhang Rong-Hua Li Guoren Wang 121 4 0 01 Apr 2025
Scene4U: Hierarchical Layered 3D Scene Reconstruction from Single Panoramic Image for Your Immerse Exploration Zilong Huang Jun-Jian He Junyan Ye Lihan Jiang Weijia Li Yuxiao Chen Ting Han 138 0 0 01 Apr 2025
On the Robustness of Agentic Function Calling Ella Rabinovich Ateret Anaby-Tavor LLMAG 74 1 0 01 Apr 2025
Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? Kai Yan Yufei Xu Zhengyin Du Xuesong Yao Ziyi Wang Xiaowen Guo Jiecao Chen ReLM ELM LRM 196 5 0 01 Apr 2025
Scaling Auditory Cognition via Test-Time Compute in Audio Language Models Ting Dang Yan Gao Hong Jia 86 0 0 30 Mar 2025
VideoGen-Eval: Agent-based System for Video Generation Evaluation Yuhang Yang Ke Fan Siyang Song Hongxiang Li Ailing Zeng FeiLin Han Wei-dong Zhai Wen Liu Yang Cao Zheng-jun Zha EGVM VGen 123 1 0 30 Mar 2025
Hyper-RAG: Combating LLM Hallucinations using Hypergraph-Driven Retrieval-Augmented Generation Yifan Feng Hao Hu Xingliang Hou Shiquan Liu Shihui Ying S. Du Han Hu Yue Gao 85 0 0 30 Mar 2025
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D Jiahui Zhang Yurui Chen Yanpeng Zhou Yueming Xu Ze Huang ... Xinyue Cai G. Huang Xingyue Quan Hang Xu Li Zhang LRM 186 2 0 29 Mar 2025
Exploiting Mixture-of-Experts Redundancy Unlocks Multimodal Generative Abilities Raman Dutt Harleen Hanspal Guoxuan Xia Petru-Daniel Tudosiu Alexander Black Yongxin Yang Jingyu Sun Sarah Parisot MoE 102 0 0 28 Mar 2025
OntoAligner: A Comprehensive Modular and Robust Python Toolkit for Ontology Alignment Hamed Babaei Giglou Jennifer D'Souza Oliver Karras Sören Auer 49 3 0 27 Mar 2025
Offline Reinforcement Learning with Discrete Diffusion Skills Ruixi Qiao Jie Cheng Xingyuan Dai Yonglin Tian Yisheng Lv OffRL 104 0 0 26 Mar 2025
MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning Yiwei Ma Guohai Xu Xiaoshuai Sun Jiayi Ji Jie Lou Debing Zhang Rongrong Ji 219 2 0 26 Mar 2025
SARGes: Semantically Aligned Reliable Gesture Generation via Intent Chain Nan Gao Yihua Bao Dongdong Weng Jiayi Zhao Jia Li Yan Zhou Pengfei Wan Di Zhang SLR 125 0 0 26 Mar 2025
Qwen2.5-Omni Technical Report Jin Xu Zhifang Guo Jinzheng He Hangrui Hu Ting He ... K. Dang Bin Zhang Xinyu Wang Yunfei Chu Junyang Lin VGen AuLLM 164 55 0 26 Mar 2025
Vision as LoRA Han Wang Yongjie Ye Bingru Li Yuxiang Nie Jinghui Lu Jingqun Tang Yanjie Wang Can Huang 137 2 0 26 Mar 2025
From Trial to Triumph: Advancing Long Video Understanding via Visual Context Sample Scaling and Self-reward Alignment Yucheng Suo Fan Ma Linchao Zhu T. Wang Fengyun Rao Yi Yang LRM 154 0 0 26 Mar 2025
RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models Mehdi Moshtaghi Siavash H. Khajavi Joni Pajarinen VLM 148 0 0 25 Mar 2025
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing Jaihoon Kim Taehoon Yoon Jisung Hwang Minhyuk Sung DiffM 179 3 0 25 Mar 2025
Scaling Vision Pre-Training to 4K Resolution Baifeng Shi Boyi Li Han Cai Yaojie Lu Sifei Liu ... Jan Kautz Enze Xie Trevor Darrell Pavlo Molchanov Hongxu Yin CLIP 411 0 0 25 Mar 2025
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning? Kexian Tang Junyao Gao Yanhong Zeng Haodong Duan Yanan Sun Zhening Xing Wenran Liu Kaifeng Lyu Kai-xiang Chen ELM LRM 144 9 0 25 Mar 2025
DeCAP: Context-Adaptive Prompt Generation for Debiasing Zero-shot Question Answering in Large Language Models Suyoung Bae YunSeok Choi Jee-Hyong Lee 71 0 0 25 Mar 2025
AudCast: Audio-Driven Human Video Generation by Cascaded Diffusion Transformers Jiazhi Guan Kaisiyuan Wang Zhiliang Xu Quanwei Yang Yasheng Sun ... Errui Ding Jiadong Wang Youjian Zhao Hang Zhou Ziwei Liu VGen 87 0 0 25 Mar 2025
LogQuant: Log-Distributed 2-Bit Quantization of KV Cache with Superior Accuracy Preservation Han Chen Zicong Jiang Zining Zhang Bingsheng He Pingyi Luo Minghao Lu Yuqiang Chen MQ 72 0 0 25 Mar 2025
Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation Dingcheng Zhen Shunshun Yin Shiyang Qin Hou Yi Ziwei Zhang Siyuan Liu Gan Qi Ming Tao VGen 103 0 0 24 Mar 2025
CQ-DINO: Mitigating Gradient Dilution via Category Queries for Vast Vocabulary Object Detection Zhichao Sun Huazhang Hu Yidong Ma Gang Liu Nemo Chen Xu Tang Feng-Long Xie Yongchao Xu ObjD 126 0 0 24 Mar 2025
CoMP: Continual Multimodal Pre-training for Vision Foundation Models Yuxiao Chen L. Meng Wujian Peng Zuxuan Wu Yu-Gang Jiang VLM 211 1 0 24 Mar 2025
Every Sample Matters: Leveraging Mixture-of-Experts and High-Quality Data for Efficient and Accurate Code LLM Codefuse Ling Team Wenting Cai Yuchen Cao Cai Chen ... Wei Zhang Zhenru Zhang Hailin Zhao Xunjin Zheng Jun Zhou ALM MoE 104 1 0 22 Mar 2025
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery Vignesh Prabhakar Md Amirul Islam Adam Atanas Yansen Wang J. N. Han ... Rucha Apte Robert Clark Kang Xu Zihan Wang Kai Liu LRM 226 5 0 22 Mar 2025
Position: Interactive Generative Video as Next-Generation Game Engine Jiwen Yu Yiran Qin Haoxuan Che Quande Liu Xintao Wang Pengfei Wan Di Zhang Xihui Liu VGen 109 4 0 21 Mar 2025
REVAL: A Comprehension Evaluation on Reliability and Values of Large Vision-Language Models Jie M. Zhang Zheng Yuan Ziyi Wang Bei Yan Sibo Wang Xiangkui Cao Zonghui Guo Shiguang Shan Xilin Chen ELM 137 0 0 20 Mar 2025
Investigating Retrieval-Augmented Generation in Quranic Studies: A Study of 13 Open-Source Large Language Models Zahra Khalila Arbi Haza Nasution Winda Monika Aytug Onan Yohei Murakami Yasir Bin Ismail Radi Noor Mohammad Osmani RALM 122 1 0 20 Mar 2025