Qwen Technical Report

28 September 2023

Jinze Bai

Shuai Bai

Yunfei Chu

Zeyu Cui

Kai Dang

Xiaodong Deng

Yang Fan

Wenbin Ge

Yu Han

Fei Huang

Binyuan Hui

Luo Ji

Mei Li

Junyang Lin

Runji Lin

Dayiheng Liu

Gao Liu

Chengqiang Lu

Keming Lu

Jianxin Ma

Rui Men

Xingzhang Ren

Xuancheng Ren

Chuanqi Tan

Sinan Tan

Jianhong Tu

Peng Wang

Shijie Wang

Wei Wang

Shengguang Wu

Benfeng Xu

Jin Xu

An Yang

Hao Yang

Jian Yang

Shusheng Yang

Yang Yao

Bowen Yu

Hongyi Yuan

Zheng Yuan

Jianwei Zhang

Xinyu Zhang

Yichang Zhang

Zhenru Zhang

Chang Zhou

Jingren Zhou

Xiaohuan Zhou

Tianhang Zhu

OSLM

ArXiv (abs)PDF HTML

Papers citing "Qwen Technical Report"

50 / 1,345 papers shown

Title
Designing Role Vectors to Improve LLM Inference Behaviour Daniele Potertì Andrea Seveso Fabio Mercorio LLMSV 93 1 0 17 Feb 2025
DAST: Context-Aware Compression in LLMs via Dynamic Allocation of Soft Tokens Shaoshen Chen Yangning Li Zishan Xu Hai-Tao Zheng Xin Su Zifei Shan Hai-Tao Zheng 68 0 0 17 Feb 2025
What Are They Filtering Out? A Survey of Filtering Strategies for Harm Reduction in Pretraining Datasets Marco Antonio Stranisci Christian Hardmeier 165 1 0 17 Feb 2025
MaZO: Masked Zeroth-Order Optimization for Multi-Task Fine-Tuning of Large Language Models Zhen Zhang Yue Yang Kai Zhen Nathan Susanj Athanasios Mouchtaris Siegfried Kunzmann Zheng Zhang 103 1 0 17 Feb 2025
Unhackable Temporal Rewarding for Scalable Video MLLMs En Yu Kangheng Lin Liang Zhao Yana Wei Zining Zhu ... Jianjian Sun Zheng Ge Xinsong Zhang Jingyu Wang Wenbing Tao 125 10 0 17 Feb 2025
SafeDialBench: A Fine-Grained Safety Benchmark for Large Language Models in Multi-Turn Dialogues with Diverse Jailbreak Attacks Hongye Cao Yanming Wang Sijia Jing Ziyue Peng Zhixin Bai ... Yang Gao Fanyu Meng Xi Yang Chao Deng Junlan Feng AAML 131 2 0 16 Feb 2025
Smoothing Out Hallucinations: Mitigating LLM Hallucination with Smoothed Knowledge Distillation Hieu Nguyen Zihao He Shoumik Atul Gandre Ujjwal Pasupulety Sharanya Kumari Shivakumar Kristina Lerman HILM 128 2 0 16 Feb 2025
The Rotary Position Embedding May Cause Dimension Inefficiency in Attention Heads for Long-Distance Retrieval Ting-Rui Chiang Dani Yogatama 52 0 0 16 Feb 2025
Fast Proxies for LLM Robustness Evaluation Tim Beyer Jan Schuchardt Leo Schwinn Stephan Günnemann AAML 105 0 0 14 Feb 2025
GoRA: Gradient-driven Adaptive Low Rank Adaptation Haonan He Peng Ye Yuchen Ren Yuan Yuan Luyang Zhou Shucun Ju Lei Chen AI4TS AI4CE 472 1 0 13 Feb 2025
Matina: A Large-Scale 73B Token Persian Text Corpus Sara Bourbour Hosseinbeigi Fatemeh Taherinezhad Heshaam Faili Hamed Baghbani Fatemeh Nadi Mostafa Amiri 164 0 0 13 Feb 2025
KABB: Knowledge-Aware Bayesian Bandits for Dynamic Expert Coordination in Multi-Agent Systems Jusheng Zhang Zimeng Huang Yijia Fan Ningyuan Liu Mingyan Li Zhuojie Yang Jiawei Yao Jian Wang Keze Wang 52 1 0 11 Feb 2025
Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations Kunal Handa Alex Tamkin Miles McCain Saffron Huang Esin Durmus ... Kevin K. Troy Dario Amodei Jared Kaplan Jack Clark Deep Ganguli MLAU 115 1 0 11 Feb 2025
Steel-LLM:From Scratch to Open Source -- A Personal Journey in Building a Chinese-Centric LLM Qingshui Gu Shu Li Tianyu Zheng Zhaoxiang Zhang 517 0 0 10 Feb 2025
Unbiased Evaluation of Large Language Models from a Causal Perspective Meilin Chen Jian Tian Liang Ma Di Xie Weijie Chen Jiang Zhu ALM ELM 164 0 0 10 Feb 2025
LessLeak-Bench: A First Investigation of Data Leakage in LLMs Across 83 Software Engineering Benchmarks Xin Zhou Martin Weyssow Ratnadira Widyasari Ting Zhang Junda He Yunbo Lyu Jianming Chang Beiqi Zhang Dan Huang David Lo PILM 611 6 0 10 Feb 2025
The Curse of Depth in Large Language Models Wenfang Sun Xinyuan Song Pengxiang Li Lu Yin Yefeng Zheng Shiwei Liu 133 7 0 09 Feb 2025
Incongruence Identification in Eyewitness Testimony Akshara Nair Zeba Afroz Md Shad Akhtar 132 0 0 08 Feb 2025
IllusionCAPTCHA: A CAPTCHA based on Visual Illusion Ziqi Ding Gelei Deng Yi Liu Junchen Ding Jieshan Chen Yulei Sui Yuekang Li 104 1 0 08 Feb 2025
XiHeFusion: Harnessing Large Language Models for Science Communication in Nuclear Fusion Xinyu Wang Qingquan Yang Fuling Wang Qiang Chen Wentao Wu ... Wanli Lv Meiwen Chen Zehua Chen Guosheng Xu Jin Tang AI4CE 102 0 0 08 Feb 2025
CodeSCM: Causal Analysis for Multi-Modal Code Generation Mukur Gupta Noopur Bhatt Suman Jana 117 1 0 07 Feb 2025
Safety Reasoning with Guidelines Haoyu Wang Zeyu Qin Li Shen Xueqian Wang Minhao Cheng Dacheng Tao 178 4 0 06 Feb 2025
Improve Decoding Factuality by Token-wise Cross Layer Entropy of Large Language Models Jialiang Wu Yi Shen Sijia Liu Yi Tang Sen Song Xiaoyi Wang Longjun Cai 94 0 0 05 Feb 2025
STAIR: Improving Safety Alignment with Introspective Reasoning Yuanhang Zhang Siyuan Zhang Yao Huang Zeyu Xia Zhengwei Fang Xiao Yang Ranjie Duan Dong Yan Yinpeng Dong Jun Zhu LRM LLMSV 152 7 0 04 Feb 2025
Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models Mingi Jung Saehuyng Lee Eunji Kim Sungroh Yoon 550 2 0 03 Feb 2025
Rethinking Mixture-of-Agents: Is Mixing Different Large Language Models Beneficial? Wenzhe Li Yong Lin Mengzhou Xia Chi Jin MoE 148 4 0 02 Feb 2025
Hypo3D: Exploring Hypothetical Reasoning in 3D Ye Mao Weixun Luo Junpeng Jing Anlan Qiu K. Mikolajczyk 214 0 0 02 Feb 2025
Vision-centric Token Compression in Large Language Model Ling Xing Alex Jinpeng Wang Rui Yan Xiangbo Shu Jinhui Tang VLM 155 0 0 02 Feb 2025
Improving Your Model Ranking on Chatbot Arena by Vote Rigging Rui Min Tianyu Pang Chao Du Qian Liu Minhao Cheng Min Lin AAML 108 4 0 29 Jan 2025
ASRank: Zero-Shot Re-Ranking with Answer Scent for Document Retrieval Abdelrahman Abdallah Jamshid Mozafari Bhawna Piryani Adam Jatowt 129 2 0 28 Jan 2025
Are Human Interactions Replicable by Generative Agents? A Case Study on Pronoun Usage in Hierarchical Interactions Naihao Deng Rada Mihalcea 90 0 0 28 Jan 2025
Commute Your Domains: Trajectory Optimality Criterion for Multi-Domain Learning Alexey Rukhovich Alexander Podolskiy Irina Piontkovskaya 96 0 0 28 Jan 2025
Baichuan-Omni-1.5 Technical Report Yadong Li Qingbin Liu Tao Zhang Tao Zhang Tian Jin ... Jianhua Xu Haoze Sun Mingan Lin Guosheng Dong Xin Wu AuLLM 178 23 0 28 Jan 2025
Qwen2.5-1M Technical Report An Yang Bowen Yu Chong Li Dayiheng Liu Fei Huang ... Xingzhang Ren Xinlong Yang You Li Zhiying Xu Zizhuo Zhang 139 29 0 28 Jan 2025
Audio-Language Models for Audio-Centric Tasks: A survey Yi Su Jisheng Bai Qisheng Xu Kele Xu Yong Dou AuLLM 164 4 0 28 Jan 2025
Parameter-Efficient Fine-Tuning for Foundation Models Dan Zhang Tao Feng Lilong Xue Yuandong Wang Yuxiao Dong J. Tang 234 12 0 23 Jan 2025
OSUM: Advancing Open Speech Understanding Models with Limited Resources in Academia Xuelong Geng Kun Wei Qijie Shao Shuiyun Liu Zhennan Lin ... Yuhang Dai Xinfa Zhu Yue Li Li Zhang Lei Xie 140 5 0 23 Jan 2025
WisdomBot: Tuning Large Language Models with Artificial Intelligence Knowledge Jingyuan Chen Tao Wu Wei Ji Leilei Gan 77 0 0 22 Jan 2025
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling Yi Wang Xinhao Li Ziang Yan Yinan He Jiashuo Yu ... Kai Chen Wenhai Wang Yu Qiao Yali Wang Limin Wang 182 51 0 21 Jan 2025
A Survey on Memory-Efficient Large-Scale Model Training in AI for Science Kaiyuan Tian Linbo Qiao Baihui Liu Gongqingjian Jiang Dongsheng Li 106 0 0 21 Jan 2025
Parameters vs FLOPs: Scaling Laws for Optimal Sparsity for Mixture-of-Experts Language Models Samira Abnar Harshay Shah Dan Busbridge Alaaeldin Mohamed Elnouby Ali J. Susskind Vimal Thilak MoE LRM 154 10 0 21 Jan 2025
PsyDI: Towards a Personalized and Progressively In-depth Chatbot for Psychological Measurements Xueyan Li Xinyan Chen Yazhe Niu Shuai Hu Yu Liu OffRL 141 3 0 17 Jan 2025
Playing Devil's Advocate: Unmasking Toxicity and Vulnerabilities in Large Vision-Language Models Abdulkadir Erol Trilok Padhi Agnik Saha Ugur Kursuncu Mehmet Emin Aktas 92 2 0 17 Jan 2025
BLEnD: A Benchmark for LLMs on Everyday Knowledge in Diverse Cultures and Languages Junho Myung Nayeon Lee Yi Zhou Jiho Jin Rifki Afina Putri ... Seid Muhie Yimam Mohammad Taher Pilehvar N. Ousidhoum Jose Camacho-Collados Alice Oh 179 55 0 17 Jan 2025
HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location Ting Sun Penghan Wang Fan Lai 549 2 0 15 Jan 2025
Logic Meets Magic: LLMs Cracking Smart Contract Vulnerabilities ZeKe Xiao Qin Wang Hammond Pearce Shiping Chen 69 4 0 13 Jan 2025
OneLLM: One Framework to Align All Modalities with Language Jiaming Han Kaixiong Gong Yiyuan Zhang Jiaqi Wang Kaipeng Zhang Dahua Lin Yu Qiao Peng Gao Xiangyu Yue MLLM 252 134 0 10 Jan 2025
Do Code LLMs Understand Design Patterns? Zhenyu Pan Xuefeng Song Yunkun Wang Rongyu Cao Binhua Li Yongqian Li Han Liu 77 3 0 10 Jan 2025
PalmBench: A Comprehensive Benchmark of Compressed Large Language Models on Mobile Platforms Yilong Li Jingyu Liu Hao Zhang M Badri Narayanan Utkarsh Sharma Shuai Zhang Pan Hu Yijing Zeng Jayaram Raghuram Suman Banerjee MQ 140 4 0 10 Jan 2025
NesTools: A Dataset for Evaluating Nested Tool Learning Abilities of Large Language Models Han Han Tong Zhu Xiang Zhang Mengsong Wu Hao Xiong Wenliang Chen 45 0 0 08 Jan 2025