Title
LiveVQA: Live Visual Knowledge Seeking Mingyang Fu Yuyang Peng Benlin Liu Yao Wan Danny Chen 62 1 0 07 Apr 2025
Judge Anything: MLLM as a Judge Across Any Modality Shu Pu Yaochen Wang Danny Chen Yuhang Chen Guohao Wang ... Zetong Zhou Shuang Gong Yi Gui Yao Wan Philip S. Yu ELM VLM 75 2 0 21 Mar 2025
Wikipedia in the Era of LLMs: Evolution and Risks Siming Huang Yuliang Xu Mingmeng Geng Yao Wan Danny Chen KELM 155 1 0 04 Mar 2025
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning DeepSeek-AI Daya Guo Dejian Yang Haowei Zhang Junxiao Song ... Shiyu Wang S. Yu Shunfeng Zhou Shuting Pan S.S. Li ReLM VLM OffRL AI4TS LRM 380 1,967 0 22 Jan 2025
OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement Tianyu Zheng Ge Zhang Tianhao Shen Xueling Liu Bill Yuchen Lin Jie Fu Wenhu Chen Xiang Yue SyDa 150 128 0 08 Jan 2025
Model Editing for LLMs4Code: How Far are We? Xiaopeng Li Shasha Li Huijun Liu Jun Ma Jie Yu Xiaodong Liu Jing Wang Shezheng Song Weimin Zhang KELM 98 4 0 11 Nov 2024
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves? Han Bao Yue Huang Yanbo Wang Jiayi Ye Xiangqi Wang Preslav Nakov Mohamed Elhoseiny Wei Wei Mohamed Elhoseiny Xiangliang Zhang 88 11 0 28 Oct 2024
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge Jiayi Ye Yanbo Wang Yue Huang Dongping Chen Qihui Zhang ... Werner Geyer Chao Huang Pin-Yu Chen Nitesh Chawla Xiangliang Zhang ELM 93 77 0 03 Oct 2024
APILOT: Navigating Large Language Models to Generate Secure Code by Sidestepping Outdated API Pitfalls Weiheng Bai Keyang Xuan Pengxiang Huang Qiushi Wu Jianing Wen Jingjing Wu Kangjie Lu LLMAG KELM 74 2 0 25 Sep 2024
Qwen2.5-Coder Technical Report Binyuan Hui Jian Yang Zeyu Cui Jiaxi Yang Dayiheng Liu ... Fei Huang Xingzhang Ren Xuancheng Ren Jingren Zhou Junyang Lin OSLM 111 331 0 18 Sep 2024
CodeUpdateArena: Benchmarking Knowledge Editing on API Updates Zeyu Leo Liu Shrey Pandit Xi Ye Eunsol Choi Greg Durrett KELM ALM 112 7 0 08 Jul 2024
DataGen: Unified Synthetic Dataset Generation via Large Language Models Yue Huang Siyuan Wu Chujie Gao Dongping Chen Qihui Zhang ... Tianyi Zhou Xiangliang Zhang Jianfeng Gao Chaowei Xiao Lichao Sun SyDa 97 20 0 27 Jun 2024
A Survey on Large Language Models for Code Generation Juyong Jiang Fan Wang Jiasi Shen Sungju Kim Sunghun Kim 115 198 0 01 Jun 2024
SimPO: Simple Preference Optimization with a Reference-Free Reward Yu Meng Mengzhou Xia Danqi Chen 135 488 0 23 May 2024
Graph Neural Networks for Vulnerability Detection: A Counterfactual Explanation Zhaoyang Chu Yao Wan Qian Li Yang Wu Hongyu Zhang Yulei Sui Guandong Xu Hai Jin AAML 75 11 0 24 Apr 2024
Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler Feedback Zhangqian Bi Yao Wan Zheng Wang Hongyu Zhang Batu Guan Fangxin Lu Zili Zhang Yulei Sui Hai Jin Xuanhua Shi 52 15 0 25 Mar 2024
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models Yaowei Zheng Richong Zhang Junhao Zhang Yanhan Ye Zheyan Luo Zhangchi Feng Yongqiang Ma 151 547 0 20 Mar 2024
ORPO: Monolithic Preference Optimization without Reference Model Jiwoo Hong Noah Lee James Thorne OSLM 86 265 0 12 Mar 2024
MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark Dongping Chen Ruoxi Chen Shilin Zhang Yinuo Liu Yaochen Wang Huichi Zhou Qihui Zhang Yao Wan Pan Zhou Lichao Sun ELM 51 122 0 07 Feb 2024
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence Daya Guo Qihao Zhu Dejian Yang Zhenda Xie Kai Dong ... Yu-Huan Wu Yiming Li Fuli Luo Yingfei Xiong W. Liang ELM 120 791 0 25 Jan 2024
Deep Learning for Code Intelligence: Survey, Benchmark and Toolkit Yao Wan Yang He Zhangqian Bi Jianguo Zhang Hongyu Zhang Yulei Sui Guandong Xu Hai Jin Philip S. Yu 70 24 0 30 Dec 2023
Faithful Persona-based Conversational Dataset Generation with Large Language Models Pegah Jandaghi XiangHai Sheng Xinyi Bai Jay Pujara Hakim Sidahmed 75 24 0 15 Dec 2023
Controlled Text Generation via Language Model Arithmetic Jasper Dekoninck Marc Fischer Luca Beurer-Kellner Martin Vechev 65 40 0 24 Nov 2023
Code Llama: Open Foundation Models for Code Baptiste Rozière Jonas Gehring Fabian Gloeckle Sten Sootla Itai Gat ... Hugo Touvron Louis Martin Nicolas Usunier Thomas Scialom Gabriel Synnaeve ELM ALM 119 2,077 0 24 Aug 2023
WizardCoder: Empowering Code Large Language Models with Evol-Instruct Ziyang Luo Can Xu Pu Zhao Qingfeng Sun Xiubo Geng Wenxiang Hu Chongyang Tao Jing Ma Qingwei Lin Daxin Jiang ELM SyDa ALM 103 687 0 14 Jun 2023
Increasing Diversity While Maintaining Accuracy: Text Data Generation with Large Language Models and Human Interventions John Joon Young Chung Ece Kamar Saleema Amershi ALM 94 121 0 07 Jun 2023
Direct Preference Optimization: Your Language Model is Secretly a Reward Model Rafael Rafailov Archit Sharma E. Mitchell Stefano Ermon Christopher D. Manning Chelsea Finn ALM 389 4,139 0 29 May 2023
CodeT5+: Open Code Large Language Models for Code Understanding and Generation Yue Wang Hung Le Akhilesh Deepak Gotmare Nghi D. Q. Bui Junnan Li Steven C. H. Hoi ALM 78 474 0 13 May 2023
StarCoder: may the source be with you! Raymond Li Loubna Ben Allal Yangtian Zi Niklas Muennighoff Denis Kocetkov ... Sean M. Hughes Thomas Wolf Arjun Guha Leandro von Werra H. D. Vries 110 777 0 09 May 2023
Instruction Tuning with GPT-4 Baolin Peng Chunyuan Li Pengcheng He Michel Galley Jianfeng Gao SyDa ALM LM&MA 228 622 0 06 Apr 2023
AugGPT: Leveraging ChatGPT for Text Data Augmentation Haixing Dai Zheng Liu Wenxiong Liao Xiaoke Huang Yihan Cao ... Lichao Sun Quanzheng Li Dinggang Shen Tianming Liu Xiang Li 105 160 0 25 Feb 2023
Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adaptors Thomas Hartvigsen S. Sankaranarayanan Hamid Palangi Yoon Kim Marzyeh Ghassemi KELM 96 177 0 20 Nov 2022
Mass-Editing Memory in a Transformer Kevin Meng Arnab Sen Sharma A. Andonian Yonatan Belinkov David Bau KELM VLM 133 599 0 13 Oct 2022
InCoder: A Generative Model for Code Infilling and Synthesis Daniel Fried Armen Aghajanyan Jessy Lin Sida I. Wang Eric Wallace Freda Shi Ruiqi Zhong Wen-tau Yih Luke Zettlemoyer M. Lewis SyDa 74 652 0 12 Apr 2022
Locating and Editing Factual Associations in GPT Kevin Meng David Bau A. Andonian Yonatan Belinkov KELM 251 1,381 0 10 Feb 2022
Cross-Language Binary-Source Code Matching with Intermediate Representations Yi Gui Yao Wan Hongyu Zhang Huifang Huang Yulei Sui Guandong Xu Zhiyuan Shao Hai Jin 49 33 0 19 Jan 2022
Evaluating Large Language Models Trained on Code Mark Chen Jerry Tworek Heewoo Jun Qiming Yuan Henrique Pondé ... Bob McGrew Dario Amodei Sam McCandlish Ilya Sutskever Wojciech Zaremba ELM ALM 236 5,647 0 07 Jul 2021
How could Neural Networks understand Programs? Dinglan Peng Shuxin Zheng Yatao Li Guolin Ke Di He Tie-Yan Liu NAI 52 64 0 10 May 2021
Knowledge Neurons in Pretrained Transformers Damai Dai Li Dong Y. Hao Zhifang Sui Baobao Chang Furu Wei KELM MU 94 463 0 18 Apr 2021
Generating Datasets with Pretrained Language Models Timo Schick Hinrich Schütze 152 235 0 15 Apr 2021
Synthetic Data Augmentation for Zero-Shot Cross-Lingual Question Answering Arij Riabi Thomas Scialom Rachel Keraron Benoît Sagot Djamé Seddah Jacopo Staiano 189 53 0 23 Oct 2020
CodeBLEU: a Method for Automatic Evaluation of Code Synthesis Shuo Ren Daya Guo Shuai Lu Long Zhou Shujie Liu Duyu Tang Neel Sundaresan M. Zhou Ambrosio Blanco Shuai Ma ELM 115 542 0 22 Sep 2020
Improving Automatic Source Code Summarization via Deep Reinforcement Learning Yao Wan Zhou Zhao Min Yang Guandong Xu Haochao Ying Jian Wu Philip S. Yu 56 392 0 17 Nov 2018
code2seq: Generating Sequences from Structured Representations of Code Uri Alon Shaked Brody Omer Levy Eran Yahav 83 700 0 04 Aug 2018
code2vec: Learning Distributed Representations of Code Uri Alon Meital Zilberstein Omer Levy Eran Yahav 53 1,181 0 26 Mar 2018
Learning to Represent Programs with Graphs Miltiadis Allamanis Marc Brockschmidt Mahmoud Khademi GNN NAI 123 804 0 01 Nov 2017
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 532 19,265 0 20 Jul 2017
Deep API Learning Xiaodong Gu Hongyu Zhang Dongmei Zhang Sunghun Kim AIMat HAI 82 558 0 27 May 2016
A Convolutional Attention Network for Extreme Summarization of Source Code Miltiadis Allamanis Hao Peng Charles Sutton AI4TS 90 583 0 09 Feb 2016
Gated Feedback Recurrent Neural Networks Junyoung Chung Çağlar Gülçehre Kyunghyun Cho Yoshua Bengio 72 830 0 09 Feb 2015