Conservative Q-Learning for Offline Reinforcement Learning

8 June 2020

Papers citing "Conservative Q-Learning for Offline Reinforcement Learning"

50 / 434 papers shown

Title
A Generalized Apprenticeship Learning Framework for Modeling Heterogeneous Student Pedagogical Strategies Md Mirajul Islam Xi Yang J. Hostetter Adittya Soukarjya Saha Min Chi 29 1 0 04 Jun 2024
Amortizing intractable inference in diffusion models for vision, language, and control S. Venkatraman Moksh Jain Luca Scimeca Minsu Kim Marcin Sendera ... Alexandre Adam Jarrid Rector-Brooks Yoshua Bengio Glen Berseth Nikolay Malkin 70 26 0 31 May 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 56 3 0 31 May 2024
Learning to Discuss Strategically: A Case Study on One Night Ultimate Werewolf Xuanfa Jin Ziyan Wang Yali Du Meng Fang Haifeng Zhang Jun Wang OffRL LLMAG 59 6 0 30 May 2024
Robust Preference Optimization through Reward Model Distillation Adam Fisch Jacob Eisenstein Vicky Zayats Alekh Agarwal Ahmad Beirami Chirag Nagpal Peter Shaw Jonathan Berant 81 22 0 29 May 2024
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning Jaewoo Lee Sujin Yun Taeyoung Yun Jinkyoo Park 52 7 0 27 May 2024
Federated Offline Policy Optimization with Dual Regularization Sheng Yue Zerui Qin Xingyuan Hua Yongheng Deng Ju Ren OffRL 34 0 0 24 May 2024
State-Constrained Offline Reinforcement Learning Charles A. Hepburn Yue Jin Giovanni Montana OffRL 41 0 0 23 May 2024
Exclusively Penalized Q-learning for Offline Reinforcement Learning Junghyuk Yeom Yonghyeon Jo Jungmo Kim Sanghyeon Lee Seungyul Han OffRL 44 2 0 23 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 82 45 0 23 May 2024
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback Kihyun Kim Jiawei Zhang Asuman Ozdaglar P. Parrilo OffRL 46 1 0 20 May 2024
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses Thanh Nguyen Tung M. Luu Tri Ton Chang D. Yoo OffRL AAML 36 0 0 18 May 2024
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning Changhong Wang Xudong Yu Chenjia Bai Qiaosheng Zhang Zhen Wang 40 1 0 12 May 2024
Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning Xiaoyu Wen Chenjia Bai Kang Xu Xudong Yu Yang Zhang Xuelong Li Zhen Wang 41 2 0 10 May 2024
RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes Kyle Stachowicz Sergey Levine 22 6 0 07 May 2024
Enhancing Q-Learning with Large Language Model Heuristics Xiefeng Wu LRM 32 0 0 06 May 2024
MF-OML: Online Mean-Field Reinforcement Learning with Occupation Measures for Large Population Games Anran Hu Junzi Zhang 41 5 0 01 May 2024
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly Hao-ming Lin Radu Corcodel Ding Zhao 40 7 0 26 Apr 2024
Rank2Reward: Learning Shaped Reward Functions from Passive Video Daniel Yang Davin Tjia Jacob Berg Dima Damen Pulkit Agrawal Abhishek Gupta OffRL 40 5 0 23 Apr 2024
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL Fangwei Zhong Kui Wu Hai Ci Churan Wang Hao Chen OffRL 39 2 0 15 Apr 2024
IBCB: Efficient Inverse Batched Contextual Bandit for Behavioral Evolution History Yi Xu Weiran Shen Xiao Zhang Jun Xu OffRL 46 0 0 24 Mar 2024
Simple Ingredients for Offline Reinforcement Learning Edoardo Cetin Andrea Tirinzoni Matteo Pirotta A. Lazaric Yann Ollivier Ahmed Touati OffRL 42 2 0 19 Mar 2024
ELA: Exploited Level Augmentation for Offline Learning in Zero-Sum Games Shiqi Lei Kanghoon Lee Linjing Li Jinkyoo Park Jiachen Li OffRL 31 1 0 28 Feb 2024
Enhancing Reinforcement Learning Agents with Local Guides Paul Daoudi Bogdan Robu Christophe Prieur Ludovic Dos Santos M. Barlier OnRL 31 3 0 21 Feb 2024
Improving a Proportional Integral Controller with Reinforcement Learning on a Throttle Valve Benchmark Paul Daoudi B. Mavkov Bogdan Robu Christophe Prieur Emmanuel Witrant M. Barlier Ludovic Dos Santos 28 2 0 21 Feb 2024
SPRINQL: Sub-optimal Demonstrations driven Offline Imitation Learning Huy Hoang Tien Mai Pradeep Varakantham OffRL 47 2 0 20 Feb 2024
MORE-3S:Multimodal-based Offline Reinforcement Learning with Shared Semantic Spaces Tianyu Zheng Ge Zhang Xingwei Qu Ming Kuang Stephen W. Huang Zhaofeng He OffRL 58 1 0 20 Feb 2024
The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning Anya Sims Cong Lu Yee Whye Teh OffRL 35 3 0 19 Feb 2024
Stitching Sub-Trajectories with Conditional Diffusion Model for Goal-Conditioned Offline RL Sungyoon Kim Yunseon Choi Daiki E. Matsunaga Kee-Eung Kim OffRL 46 6 0 11 Feb 2024
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices Jiin Woo Laixi Shi Gauri Joshi Yuejie Chi OffRL 34 3 0 08 Feb 2024
Offline Actor-Critic Reinforcement Learning Scales to Large Models Jost Tobias Springenberg A. Abdolmaleki Jingwei Zhang Oliver Groth Michael Bloesch ... Sarah Bechtle Steven Kapturowski Roland Hafner N. Heess Martin Riedmiller OffRL LRM 35 12 0 08 Feb 2024
Return-Aligned Decision Transformer Tsunehiko Tanaka Kenshi Abe Kaito Ariu Tetsuro Morimura Edgar Simo-Serra OffRL 69 1 0 06 Feb 2024
The RL/LLM Taxonomy Tree: Reviewing Synergies Between Reinforcement Learning and Large Language Models M. Pternea Prerna Singh Abir Chakraborty Y. Oruganti M. Milletarí Sayli Bapat Kebei Jiang OffRL 33 7 0 02 Feb 2024
MoMA: Model-based Mirror Ascent for Offline Reinforcement Learning Mao Hong Zhiyue Zhang Yue Wu Yan Xu OffRL 50 0 0 21 Jan 2024
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning Rafael Rafailov Kyle Hatch Victor Kolev John D. Martin Mariano Phielipp Chelsea Finn OffRL OnRL 22 10 0 06 Jan 2024
HAIM-DRL: Enhanced Human-in-the-loop Reinforcement Learning for Safe and Efficient Autonomous Driving Zilin Huang Zihao Sheng Chengyuan Ma Sikai Chen 22 29 0 06 Jan 2024
RL-MPCA: A Reinforcement Learning Based Multi-Phase Computation Allocation Approach for Recommender Systems Jiahong Zhou Shunhui Mao Guoliang Yang Bo Tang Qianlong Xie Lebin Lin Xingxing Wang Dong Wang 37 7 0 27 Dec 2023
Conservative Exploration for Policy Optimization via Off-Policy Policy Evaluation Paul Daoudi Mathias Formoso Othman Gaizi Achraf Azize Evrard Garcelon OffRL 26 0 0 24 Dec 2023
Neural Network Approximation for Pessimistic Offline Reinforcement Learning Di Wu Yuling Jiao Li Shen Haizhao Yang Xiliang Lu OffRL 34 1 0 19 Dec 2023
Learning to Act without Actions Dominik Schmidt Minqi Jiang OffRL 34 31 0 17 Dec 2023
Multi-agent Reinforcement Learning: A Comprehensive Survey Dom Huh Prasant Mohapatra AI4CE 36 8 0 15 Dec 2023
ToP-ToM: Trust-aware Robot Policy with Theory of Mind Chuang Yu Baris Serhan Angelo Cangelosi 32 2 0 07 Nov 2023
A Tractable Inference Perspective of Offline RL Xuejie Liu Guy Van den Broeck Mathias Niepert Yitao Liang OffRL 36 1 0 31 Oct 2023
Hybrid Search for Efficient Planning with Completeness Guarantees Kalle Kujanpää Joni Pajarinen Alexander Ilin 31 3 0 19 Oct 2023
End-to-end Offline Reinforcement Learning for Glycemia Control Tristan Beolet Alice Adenis E. Huneker Maxime Louis OffRL 38 1 0 16 Oct 2023
Latent Conservative Objective Models for Data-Driven Crystal Structure Prediction Han Qi Xinyang Geng Stefano Rando Iku Ohama Aviral Kumar Sergey Levine DiffM 50 2 0 16 Oct 2023
Offline Reinforcement Learning for Optimizing Production Bidding Policies D. Korenkevych Frank Cheng Artsiom Balakir Alex Nikulkov Lingnan Gao Zhihao Cen Zuobing Xu Zheqing Zhu OffRL 31 1 0 13 Oct 2023
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Max Sobol Mark Archit Sharma Fahim Tajwar Rafael Rafailov Sergey Levine Chelsea Finn OffRL OnRL 34 1 0 12 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 43 20 0 10 Oct 2023
Memory-Consistent Neural Networks for Imitation Learning Kaustubh Sridhar Souradeep Dutta Dinesh Jayaraman James Weimer Insup Lee 44 8 0 09 Oct 2023