Title
Ghost Policies: A New Paradigm for Understanding and Learning from Failure in Deep Reinforcement Learning Xabier Olaz 21 0 0 14 Jun 2025
REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards Zafir Stojanovski Oliver Stanley Joe Sharratt Richard Jones Abdulhakeem Adefioye Jean Kaddour Andreas Kopf OffRL LRM 66 1 0 30 May 2025
Bidirectional Distillation: A Mixed-Play Framework for Multi-Agent Generalizable Behaviors Lang Feng Jiahao Lin Dong Xing Li Zhang De Ma Gang Pan 99 0 0 16 May 2025
Diffusion Stochastic Learning Over Adaptive Competing Networks Yike Zhao H. Cai Ali H. Sayed DiffM 66 0 0 28 Apr 2025
Abstracting Geo-specific Terrains to Scale Up Reinforcement Learning Volkan Ustun Soham Hans Rajay Kumar Yunzhe Wang AI4CE 65 0 0 25 Mar 2025
ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies Pedro Sequeira Vidyasagar Sadhu Melinda Gervasio DiffM 172 0 0 25 Feb 2025
Human-like Bots for Tactical Shooters Using Compute-Efficient Sensors Niels Justesen Maria Kaselimi Sam Snodgrass Miruna Vozaru Matthew Schlegel ... Albert Wang Christoffer Holmgård Georgios N. Yannakakis S. Risi Julian Togelius 193 0 0 03 Jan 2025
Agent-Temporal Credit Assignment for Optimal Policy Preservation in Sparse Multi-Agent Reinforcement Learning Aditya Kapoor Sushant Swamy Kale-ab Abebe Tessera Mayank Baranwal Mingfei Sun H. Khadilkar Stefano V. Albrecht 93 0 0 19 Dec 2024
Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge Weihua Du Qiushi Lyu Jiaming Shan Zhenting Qi Hongxin Zhang ... Andi Peng Tianmin Shu Kwonjoon Lee Behzad Dariush Chuang Gan 118 2 0 04 Nov 2024
Guiding Multi-agent Multi-task Reinforcement Learning by a Hierarchical Framework with Logical Reward Shaping Chanjuan Liu Jinmiao Cong Bingcai Chen Yaochu Jin Enqiang Zhu 92 1 0 02 Nov 2024
Learning in Markov Games with Adaptive Adversaries: Policy Regret, Fundamental Barriers, and Efficient Algorithms Thanh Nguyen-Tang Raman Arora 115 1 0 01 Nov 2024
GPT for Games: An Updated Scoping Review (2020-2024) Daijin Yang Erica Kleinman Casper Harteveld LLMAG AI4TS AI4CE 188 3 0 01 Nov 2024
SRAP-Agent: Simulating and Optimizing Scarce Resource Allocation Policy with LLM-based Agent Jiarui Ji Yang Li Hongtao Liu Zhicheng Du Zhewei Wei Weiran Shen Qi Qi Yankai Lin 54 2 0 18 Oct 2024
Transformer Guided Coevolution: Improved Team Selection in Multiagent Adversarial Team Games Pranav Rajbhandari Prithviraj Dasgupta D. Sofge 112 0 0 17 Oct 2024
Training Interactive Agent in Large FPS Game Map with Rule-enhanced Reinforcement Learning Chen Zhang Huan Hu Yuan Zhou Qiyang Cao Ruochen Liu Wenya Wei Elvis S. Liu AI4CE 116 0 0 07 Oct 2024
Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration Yun Qu Boyuan Wang Yuhang Jiang Jianzhun Shao Yixiu Mao Cheems Wang Chang Liu Xiangyang Ji 135 5 0 03 Oct 2024
Value-Based Deep Multi-Agent Reinforcement Learning with Dynamic Sparse Training Pihe Hu Shaolong Li Zhuoran Li L. Pan Longbo Huang 42 0 0 28 Sep 2024
Can VLMs Play Action Role-Playing Games? Take Black Myth Wukong as a Study Case Peng Chen Pi Bu Jun Song Yuan Gao Bo Zheng LLMAG 94 11 0 19 Sep 2024
Learning to Move Like Professional Counter-Strike Players David Durst Feng Xie Vishnu Sarukkai Brennan Shacklett I. Frosio ... Carly Taylor Gilbert Bernstein Sanjiban Choudhury Pat Hanrahan Kayvon Fatahalian 73 0 0 25 Aug 2024
Multi-Agent Reinforcement Learning for Autonomous Driving: A Survey Ruiqi Zhang Jing Hou Florian Walter Shangding Gu Jiayi Guan Florian Röhrbein Yali Du Panpan Cai G. Chen Alois Knoll 134 15 0 19 Aug 2024
Environment Complexity and Nash Equilibria in a Sequential Social Dilemma Mustafa Yasir Andrew Howes V. Mavroudis Chris Hicks 119 0 0 04 Aug 2024
A Survey on Self-play Methods in Reinforcement Learning Chao Yu Zelai Xu Chengdong Ma Chao Yu Weijuan Tu ... Deheng Ye Wenbo Ding Yaodong Yang Yu Wang Yu Wang SyDa SSL OnRL 172 9 0 02 Aug 2024
Combining Automated Optimisation of Hyperparameters and Reward Shape Julian Dierkes Emma Cramer Holger Hoos Sebastian Trimpe 102 1 0 26 Jun 2024
Learned Graph Rewriting with Equality Saturation: A New Paradigm in Relational Query Rewrite and Beyond George-Octavian Barbulescu Taiyi Wang Zak Singh Eiko Yoneki 89 2 0 19 Jun 2024
EvIL: Evolution Strategies for Generalisable Imitation Learning Silvia Sapora Gokul Swamy Chris Xiaoxuan Lu Yee Whye Teh Jakob Nicolaus Foerster 83 6 0 15 Jun 2024
On the Utility of Accounting for Human Beliefs about AI Intention in Human-AI Collaboration Guanghui Yu Robert Kasumba Chien-Ju Ho William Yeoh 66 0 0 10 Jun 2024
Advancing DRL Agents in Commercial Fighting Games: Training, Integration, and Agent-Human Alignment Chen Zhang Qiang He Zhou Yuan Elvis S. Liu Hong Wang Jian Zhao Yang-Feng Wang 118 2 0 03 Jun 2024
LLM-Based Cooperative Agents using Information Relevance and Plan Validation SeungWon Seo Junhyeok Lee SeongRae Noh HyeongYeop Kang 47 0 0 27 May 2024
Mimicry and the Emergence of Cooperative Communication Dylan R. Cope Peter McBurney 89 0 0 26 May 2024
A CMDP-within-online framework for Meta-Safe Reinforcement Learning Vanshaj Khattar Yuhao Ding Bilgehan Sel Javad Lavaei Ming Jin OffRL 87 13 0 26 May 2024
Controlling Behavioral Diversity in Multi-Agent Reinforcement Learning Matteo Bettini Ryan Kortvelesy Amanda Prorok 69 7 0 23 May 2024
A social path to human-like artificial intelligence Edgar A. Duénez-Guzmán Suzanne Sadedin Jane X. Wang Kevin R. McKee Joel Z Leibo GNN 98 30 0 22 May 2024
Reinforcement learning Florentin Wörgötter 112 2,528 0 16 May 2024
GPT for Games: A Scoping Review (2020-2023) Daijin Yang Erica Kleinman Casper Harteveld AI4TS AI4CE 137 14 0 27 Apr 2024
COMBO: Compositional World Models for Embodied Multi-Agent Cooperation Hongxin Zhang Zeyuan Wang Qiushi Lyu Zheyuan Zhang Sunli Chen Tianmin Shu Yilun Du Kwonjoon Lee Yilun Du Chuang Gan 169 18 0 16 Apr 2024
Hierarchical Decision Making Based on Structural Information Principles Xianghua Zeng Hao Peng Dingli Su Angsheng Li 77 0 0 15 Apr 2024
Generalized Population-Based Training for Hyperparameter Optimization in Reinforcement Learning Hui Bai Ran Cheng 88 6 0 12 Apr 2024
SENSOR: Imitate Third-Person Expert's Behaviors via Active Sensoring Kaichen Huang Minghao Shao Shenghua Wan Hai-Hang Sun Shuai Feng Le Gan De-Chuan Zhan 82 0 0 04 Apr 2024
Benchmarking Population-Based Reinforcement Learning across Robotic Tasks with GPU-Accelerated Simulation Asad Ali Shahid Yashraj S. Narang Vincenzo Petrone Enrico Ferrentino Ankur Handa Dieter Fox Marco Pavone L. Roveda 106 3 0 04 Apr 2024
Automated System-level Testing of Unmanned Aerial Systems Hassan Sartaj Asmar Muqeet Muhammad Zohaib Z. Iqbal Muhammad Uzair Khan 20 5 0 23 Mar 2024
A Survey on Applications of Reinforcement Learning in Spatial Resource Allocation Di Zhang Moyang Wang Joseph D Mango Xiang Li Xianrui Xu 109 1 0 06 Mar 2024
Deep Reinforcement Learning (DRL)-based Methods for Serverless Stream Processing Engines: A Vision, Architectural Elements, and Future Directions Maria R. Read C. Dehury S. Srirama Rajkumar Buyya AI4TS OffRL 52 1 0 27 Feb 2024
Scaling Artificial Intelligence for Digital Wargaming in Support of Decision-Making Scotty Black Christian J. Darken 27 2 0 08 Feb 2024
A computational approach to visual ecology with deep reinforcement learning Sacha Sokoloski Jure Majnik Philipp Berens 25 0 0 07 Feb 2024
Social Interpretable Reinforcement Learning Leonardo Lucio Custode Giovanni Iacca OffRL 248 2 0 27 Jan 2024
Visual Imitation Learning with Calibrated Contrastive Representation Yunke Wang Linwei Tao Bo Du Yutian Lin Chang Xu 68 0 0 21 Jan 2024
Neural Population Learning beyond Symmetric Zero-sum Games Siqi Liu Luke Marris Marc Lanctot Georgios Piliouras Joel Z Leibo N. Heess MLT 95 3 0 10 Jan 2024
Behavioural Cloning in VizDoom Ryan Spick Timothy Bradley Ayush Raina P. Amadori Guy Moss LM&Ro 54 1 0 08 Jan 2024
Scaling Opponent Shaping to High Dimensional Games Akbir Khan Timon Willi Newton Kwan Andrea Tacchetti Chris Xiaoxuan Lu Edward Grefenstette Tim Rocktaschel Jakob N. Foerster 82 10 0 19 Dec 2023
Multi-agent Reinforcement Learning: A Comprehensive Survey Dom Huh Prasant Mohapatra AI4CE 82 10 0 15 Dec 2023