Addressing Optimism Bias in Sequence Modeling for Reinforcement Learning

21 July 2022

Papers citing "Addressing Optimism Bias in Sequence Modeling for Reinforcement Learning"

10 / 10 papers shown

Title
YESciEval: Robust LLM-as-a-Judge for Scientific Question Answering Jennifer D'Souza Hamed Babaei Giglou Quentin Münch ELM 43 0 0 20 May 2025
DuoSpaceNet: Leveraging Both Bird's-Eye-View and Perspective View Representations for 3D Object Detection Zhe Huang Yizhe Zhao Hao Xiao Chenyan Wu Lingting Ge 3DPC 60 1 0 17 May 2024
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 246 874 0 12 Oct 2021
Vector Quantized Models for Planning Sherjil Ozair Yazhe Li Ali Razavi Ioannis Antonoglou Aaron van den Oord Oriol Vinyals OffRL 36 49 0 08 Jun 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 90 665 0 03 Jun 2021
Multi-Modal Fusion Transformer for End-to-End Autonomous Driving Aditya Prakash Kashyap Chitta Andreas Geiger ViT 71 518 0 19 Apr 2021
Mastering Atari with Discrete World Models Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba DRL 64 834 0 05 Oct 2020
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 80 1,780 0 08 Jun 2020
MOReL : Model-Based Offline Reinforcement Learning Rahul Kidambi Aravind Rajeswaran Praneeth Netrapalli Thorsten Joachims OffRL 53 662 0 12 May 2020
D4RL: Datasets for Deep Data-Driven Reinforcement Learning Justin Fu Aviral Kumar Ofir Nachum George Tucker Sergey Levine GP OffRL 161 1,338 0 15 Apr 2020