Qwen Technical Report

28 September 2023

Jinze Bai

Shuai Bai

Yunfei Chu

Zeyu Cui

Kai Dang

Xiaodong Deng

Yang Fan

Wenbin Ge

Yu Han

Fei Huang

Binyuan Hui

Luo Ji

Mei Li

Junyang Lin

Runji Lin

Dayiheng Liu

Gao Liu

Chengqiang Lu

Keming Lu

Jianxin Ma

Rui Men

Xingzhang Ren

Xuancheng Ren

Chuanqi Tan

Sinan Tan

Jianhong Tu

Peng Wang

Shijie Wang

Wei Wang

Shengguang Wu

Benfeng Xu

Jin Xu

An Yang

Hao Yang

Jian Yang

Shusheng Yang

Yang Yao

Bowen Yu

Hongyi Yuan

Zheng Yuan

Jianwei Zhang

Xinyu Zhang

Yichang Zhang

Zhenru Zhang

Chang Zhou

Jingren Zhou

Xiaohuan Zhou

Tianhang Zhu

OSLM

ArXiv (abs)PDF HTML

Papers citing "Qwen Technical Report"

50 / 1,345 papers shown

Title
Addressing Overprescribing Challenges: Fine-Tuning Large Language Models for Medication Recommendation Tasks Zihao Zhao Chenxiao Fan Chongming Gao Fuli Feng Xiangnan He LM&MA AI4MH 106 1 0 05 Mar 2025
IterPref: Focal Preference Learning for Code Generation via Iterative Debugging Jie Wu Haoling Li Xin Zhang Jianwen Luo Yangyu Huang Ruihang Chu Yue Yang Scarlett Li 124 1 0 04 Mar 2025
Towards Explainable Doctor Recommendation with Large Language Models Ziyang Zeng Dongyuan Li Yuqing Yang LM&MA AI4TS 111 0 0 04 Mar 2025
PanguIR Technical Report for NTCIR-18 AEOLLM Task Lang Mei Chong Chen Jiaxin Mao ALM 72 1 0 04 Mar 2025
A Zero-Shot Learning Approach for Ephemeral Gully Detection from Remote Sensing using Vision Language Models Seyed Mohamad Ali Tousi Ramy M. A. Farag Jacket Demby's Gbenga Omotara John A. Lory Guilherme N. DeSouza 474 0 0 03 Mar 2025
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models Y. Huang Peng Ye Chenyu Huang Jianjian Cao Lin Zhang Baopu Li Gang Yu Tao Chen MoMe MoE 90 3 0 03 Mar 2025
GPIoT: Tailoring Small Language Models for IoT Program Synthesis and Development Leming Shen Qiang Yang Xinyu Huang Zijing Ma Yuanqing Zheng 103 1 0 02 Mar 2025
How Deep is Love in LLMs' Hearts? Exploring Semantic Size in Human-like Cognition Yao Yao Yifei Yang Xinbei Ma Dongjie Yang Zhuosheng Zhang Zuchao Li Hai Zhao 84 0 0 01 Mar 2025
Retrieval Backward Attention without Additional Training: Enhance Embeddings of Large Language Models via Repetition Yifei Duan Raphael Shang Deng Liang Yongqiang Cai 128 0 0 28 Feb 2025
RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete Yuheng Ji Huajie Tan Jiayu Shi Xiaoshuai Hao Yuan Zhang ... Huaihai Lyu Xiaolong Zheng Jiaming Liu Zhongyuan Wang Shanghang Zhang 187 15 0 28 Feb 2025
Set-Theoretic Compositionality of Sentence Embeddings Naman Bansal Yash Mahajan Sanjeev Kumar Sinha S. Karmaker CoGe 108 0 0 28 Feb 2025
LexRAG: Benchmarking Retrieval-Augmented Generation in Multi-Turn Legal Consultation Conversation Haitao Li Yexin Chen Yiran Hu Qingyao Ai Junjie Chen Xiaoyu Yang J. Yang Yueyue Wu Zeyang Liu Yang Liu AILaw RALM ELM 113 0 0 28 Feb 2025
OpenEarthSensing: Large-Scale Fine-Grained Benchmark for Open-World Remote Sensing Xiang Xiang Zhuo Xu Yao Deng Qinhao Zhou Yifan Liang Ke Chen Qingfang Zheng Yaowei Wang Xilin Chen Wen Gao VLM 138 0 0 28 Feb 2025
Mitigating Hallucinations in Large Vision-Language Models by Adaptively Constraining Information Flow Jiaqi Bai Hongcheng Guo Zhongyuan Peng Jian Yang Zhiyu Li Mingze Li Zhihong Tian VLM 95 2 0 28 Feb 2025
ConvCodeWorld: Benchmarking Conversational Code Generation in Reproducible Feedback Environments Hojae Han Seung-won Hwang Rajhans Samdani Yuxiong He ALM 109 4 0 27 Feb 2025
Sensing and Steering Stereotypes: Extracting and Applying Gender Representation Vectors in LLMs Hannah Cyberey Yangfeng Ji David Evans LLMSV 177 1 0 27 Feb 2025
The Lookahead Limitation: Why Multi-Operand Addition is Hard for LLMs Tanja Baeumel Josef van Genabith Simon Ostermann LRM 122 1 0 27 Feb 2025
HaLoRA: Hardware-aware Low-Rank Adaptation for Large Language Models Based on Hybrid Compute-in-Memory Architecture Taiqiang Wu Chenchen Ding Wenyong Zhou Yuxin Cheng Xincheng Feng Shuqi Wang Chufan Shi Ziyue Liu Ngai Wong 130 0 0 27 Feb 2025
UniCodec: Unified Audio Codec with Single Domain-Adaptive Codebook Yiheng Jiang Qian Chen Shengpeng Ji Yu Xi Wen Wang Chuxu Zhang Xianghu Yue Shiliang Zhang Haoyang Li 103 1 0 27 Feb 2025
Can Large Language Models Unveil the Mysteries? An Exploration of Their Ability to Unlock Information in Complex Scenarios Chao Wang Luning Zhang Ziyi Wang Yang Zhou ELM VLM LRM 120 1 0 27 Feb 2025
Towards Label-Only Membership Inference Attack against Pre-trained Large Language Models Yu He Boheng Li Lu Liu Zhongjie Ba Wei Dong Yiming Li Zhan Qin Kui Ren Chong Chen MIALM 178 3 0 26 Feb 2025
Exploring Graph Tasks with Pure LLMs: A Comprehensive Benchmark and Investigation Yansen Wang Xinnan Dai Wenqi Fan Yao Ma 144 2 0 26 Feb 2025
MA-GTS: A Multi-Agent Framework for Solving Complex Graph Problems in Real-World Applications Zike Yuan Ming Liu Hui Wang Bing Qin LLMAG AI4CE 62 0 0 25 Feb 2025
LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation Pengzhi Li Pengfei Yu Zide Liu Wei He Xuhao Pan Xudong Rao Tao Wei Wei Chen VLM 155 0 0 25 Feb 2025
AutoCas: Autoregressive Cascade Predictor in Social Networks via Large Language Models Yuhao Zheng Chenghua Gong Rui Sun Juyuan Zhang Liming Pan Linyuan Lv 136 0 0 25 Feb 2025
Retrieval-Augmented Speech Recognition Approach for Domain Challenges Peng Shen Xugang Lu Hisashi Kawai RALM 97 0 0 24 Feb 2025
LongAttn: Selecting Long-context Training Data via Token-level Attention Longyun Wu Dawei Zhu Guangxiang Zhao Zhuocheng Yu Junfeng Ran Xiangyu Wong Lin Sun Sujian Li 108 2 0 24 Feb 2025
Order Matters: Investigate the Position Bias in Multi-constraint Instruction Following Jie Zeng Qianyu He Qingyu Ren Jiaqing Liang Yanghua Xiao Weikang Zhou Zeye Sun Fei Yu 125 1 0 24 Feb 2025
Do LLMs Make Mistakes Like Students? Exploring Natural Alignment between Language Models and Human Error Patterns Naiming Liu Shashank Sonkar Richard Baraniuk AI4Ed 117 0 0 24 Feb 2025
Pastiche Novel Generation Creating: Fan Fiction You Love in Your Favorite Author's Style Xueran Han Yuhan Liu Mingzhe Li Wen Liu Sen Hu Rui Yan Zhiqiang Xu Preslav Nakov 104 0 0 24 Feb 2025
Intrinsic Model Weaknesses: How Priming Attacks Unveil Vulnerabilities in Large Language Models Yuyi Huang Runzhe Zhan Derek F. Wong Lidia S. Chao Ailin Tao AAML SyDa ELM 69 0 0 23 Feb 2025
SQLong: Enhanced NL2SQL for Longer Contexts with LLMs Dai Quoc Nguyen Cong Duy Vu Hoang Duy Vu Gioacchino Tangari Thanh Tien Vu Don Dharmasiri Yuan-Fang Li Long Duong 110 0 0 23 Feb 2025
Dynamic Parallel Tree Search for Efficient LLM Reasoning Yifu Ding Wentao Jiang Shunyu Liu Yongcheng Jing Jinpei Guo ... Zengmao Wang Ziqiang Liu Di Lin Xianglong Liu Dacheng Tao LRM 122 11 0 22 Feb 2025
EPERM: An Evidence Path Enhanced Reasoning Model for Knowledge Graph Question and Answering Xiao Long Liansheng Zhuang Aodi Li Minghong Yao Shafei Wang RALM LRM 70 1 0 22 Feb 2025
Understanding Zero-shot Rare Word Recognition Improvements Through LLM Integration Haoxuan Wang 72 0 0 22 Feb 2025
Merger-as-a-Stealer: Stealing Targeted PII from Aligned LLMs with Model Merging Lin Lu Zhigang Zuo Ziji Sheng Pan Zhou MoMe 131 0 0 22 Feb 2025
T2ISafety: Benchmark for Assessing Fairness, Toxicity, and Privacy in Image Generation Lijun Li Zhelun Shi Xuhao Hu Bowen Dong Yiran Qin Xihui Liu Lu Sheng Jing Shao 148 2 0 21 Feb 2025
Enhancing Domain-Specific Retrieval-Augmented Generation: Synthetic Data Generation and Evaluation using Reasoning Models Aryan Jadon Avinash Patil Shashank Kumar SyDa 85 1 0 21 Feb 2025
SafeInt: Shielding Large Language Models from Jailbreak Attacks via Safety-Aware Representation Intervention Jiaqi Wu Chen Chen Chunyan Hou Xiaojie Yuan AAML 132 0 0 21 Feb 2025
Forgotten Polygons: Multimodal Large Language Models are Shape-Blind William Rudman Michal Golovanesky Amir Bar Vedant Palit Yann LeCun Carsten Eickhoff Ritambhara Singh LRM 180 4 0 21 Feb 2025
QUILL: Quotation Generation Enhancement of Large Language Models Jin Xiao Bowei Zhang Qianyu He Jiaqing Liang Feng Wei Jinglei Chen Zujie Liang Deqing Yang Yanghua Xiao HILM LRM 234 0 0 21 Feb 2025
Pragmatic Reasoning improves LLM Code Generation Zhuchen Cao Sven Apel Adish Singla Vera Demberg LRM 125 0 0 20 Feb 2025
MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models Zihao Wei Jingcheng Deng Liang Pang Hanxing Ding Huawei Shen Xueqi Cheng KELM 141 7 0 20 Feb 2025
LESA: Learnable LLM Layer Scaling-Up Yifei Yang Zouying Cao Xinbei Ma Yao Yao L. Qin Zhongfu Chen Hai Zhao 177 0 0 20 Feb 2025
OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment Xiangjin Xie Guangwei Xu Lingyan Zhao Ruijie Guo AI4TS 71 9 0 19 Feb 2025
DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs Minxuan Lv Zhenpeng Su Leiyu Pan Yizhe Xiong Zijia Lin ... Guiguang Ding Cheng Luo Di Zhang Kun Gai Songlin Hu MoE 116 0 0 18 Feb 2025
SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning Junkai Chen Zhijie Deng Kening Zheng Yibo Yan Shuliang Liu PeiJun Wu Peijie Jiang Qingbin Liu Xuming Hu MU 112 8 0 18 Feb 2025
EquiBench: Benchmarking Large Language Models' Understanding of Program Semantics via Equivalence Checking Anjiang Wei Jiannan Cao Ran Li Hong Chen Yuhui Zhang ... Yuan Liu Thiago S. F. X. Teixeira Diyi Yang Ke Wang Ke Wang LRM 104 1 0 18 Feb 2025
Baichuan-M1: Pushing the Medical Capability of Large Language Models Binghai Wang Haizhou Zhao Huozhi Zhou Liang Song Mingyu Xu ... Yan Zhang Yifei Duan Yuyan Zhou Zhi-Ming Ma Zhikai Wu LM&MA ELM AI4MH 121 10 0 18 Feb 2025
Designing Role Vectors to Improve LLM Inference Behaviour Daniele Potertì Andrea Seveso Fabio Mercorio LLMSV 93 1 0 17 Feb 2025