QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation

27 June 2018

Papers citing "QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation"

50 / 378 papers shown

Title
When to retrain a machine learning model Regol Florence Schwinn Leo Sprague Kyle Coates Mark Markovich Thomas OffRL 7 0 0 20 May 2025
Sample Efficient Reinforcement Learning via Large Vision Language Model Distillation Donghoon Lee Tung M. Luu Younghwan Lee Chang D. Yoo OffRL VLM 14 0 0 16 May 2025
Guiding Data Collection via Factored Scaling Curves Lihan Zha Apurva Badithela Michael Zhang Justin Lidard Jeremy Bao Emily Zhou David Snyder Allen Z. Ren Dhruv Shah Anirudha Majumdar OffRL 34 0 0 12 May 2025
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions Qingwen Bu Yanting Yang Jisong Cai Shenyuan Gao Guanghui Ren Maoqing Yao Ping Luo Hongyang Li 197 2 0 09 May 2025
Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation Abdulaziz Almuzairee Rohan Patil Dwait Bhatt Henrik I. Christensen 36 0 0 07 May 2025
Prompt-responsive Object Retrieval with Memory-augmented Student-Teacher Learning Malte Mosbach Sven Behnke 36 0 0 04 May 2025
Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control Haoran Wang Zhiwei Shi Chengxi Zhu Yafei Qiao Cheng Zhang Fan Yang Pengjie Ren Lan Lu D. Xuan 71 1 0 24 Apr 2025
PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation Wenxuan Li Hang Zhao Zhiyuan Yu Yu Du Qin Zou Ruizhen Hu K. Xu SSL 83 1 0 23 Apr 2025
Bridging Deep Reinforcement Learning and Motion Planning for Model-Free Navigation in Cluttered Environments Licheng Luo Mingyu Cai 38 0 0 09 Apr 2025
Tapered Off-Policy REINFORCE: Stable and efficient reinforcement learning for LLMs Nicolas Le Roux Marc G. Bellemare Jonathan Lebensold Arnaud Bergeron Joshua Greaves Alex Fréchette Carolyne Pelletier Eric Thibodeau-Laufer Sándor Toth Sam Work OffRL 91 4 0 18 Mar 2025
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model Jiaming Liu Hao Chen Pengju An Zhuoyang Liu Renrui Zhang ... Chengkai Hou Mengdi Zhao KC alex Zhou Pheng-Ann Heng Shanghang Zhang 77 9 0 13 Mar 2025
PoseLess: Depth-Free Vision-to-Joint Control via Direct Image Mapping with VLM Alan Dao Dinh Bach Vu Tuan Le Duc Anh Bui Quang Huy 48 0 0 10 Mar 2025
Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control T. Lee Donghwan Lee 35 0 0 28 Feb 2025
SALSA-RL: Stability Analysis in the Latent Space of Actions for Reinforcement Learning Xuyang Li Romit Maulik 48 0 0 24 Feb 2025
MILE: Model-based Intervention Learning Yigit Korkmaz Erdem Bıyık 93 2 0 21 Feb 2025
COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping Jun Yamada Alexander L. Mitchell Jack Collins Ingmar Posner OffRL 90 0 0 17 Feb 2025
Advancing Autonomous VLM Agents via Variational Subgoal-Conditioned Reinforcement Learning Qingyuan Wu Jianheng Liu Haifeng Zhang Jun Wang Kun Shao OffRL 107 1 0 11 Feb 2025
Adaptive Grasping of Moving Objects in Dense Clutter via Global-to-Local Detection and Static-to-Dynamic Planning Hao Chen Takuya Kiyokawa Weiwei Wan Kensuke Harada 61 0 0 09 Feb 2025
Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation Ziyang Xie Zhizheng Liu Zhenghao Peng Wayne Wu Bolei Zhou VGen 56 3 0 12 Jan 2025
DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning Utsav Singh Souradip Chakraborty Wesley A Suttle Brian M. Sadler Vinay P. Namboodiri Amrit Singh Bedi OffRL 53 0 0 03 Jan 2025
Perception Stitching: Zero-Shot Perception Encoder Transfer for Visuomotor Robot Policies Pingcheng Jian Easop Lee Zachary I. Bell Michael M. Zavlanos Boyuan Chen 97 1 0 03 Jan 2025
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning Kun Wu Yinuo Zhao Zhihao Xu Zhengping Che Chengxiang Yin C. Liu Qinru Qiu Feiferi Feng OffRL 109 1 0 22 Dec 2024
Sample-efficient Unsupervised Policy Cloning from Ensemble Self-supervised Labeled Videos Xin Liu Yaran Chen Haoran Li SSL 96 0 0 14 Dec 2024
Environment as Policy: Learning to Race in Unseen Tracks Hongze Wang Jiaxu Xing Nico Messikommer Davide Scaramuzza 34 1 0 29 Oct 2024
Triplane Grasping: Efficient 6-DoF Grasping with Single RGB Images Yiming Li Hanchi Ren Yue Yang Jingjing Deng Xianghua Xie 41 0 0 21 Oct 2024
DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation Jaehyun Park Yunho Kim Sejin Kim Byung-Jun Lee Sundong Kim OffRL 39 1 0 15 Oct 2024
RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation Songming Liu Lingxuan Wu Bangguo Li Hengkai Tan Huayu Chen Zhengyi Wang Ke Xu Hang Su Jun Zhu 45 85 0 10 Oct 2024
Efficient Policy Evaluation with Safety Constraint for Reinforcement Learning Claire Chen Shuze Liu Shangtong Zhang OffRL 180 1 0 08 Oct 2024
Synthesizing Interpretable Control Policies through Large Language Model Guided Search Carlo Bosio Mark W. Mueller 32 0 0 07 Oct 2024
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 66 2 0 04 Oct 2024
Doubly Optimal Policy Evaluation for Reinforcement Learning Shuze Liu Claire Chen Shangtong Zhang OffRL 43 2 0 03 Oct 2024
Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy Ricardo Garcia Shizhe Chen Cordelia Schmid LM&Ro 47 8 0 02 Oct 2024
Autonomous loading of ore piles with Load-Haul-Dump machines using Deep Reinforcement Learning Rodrigo Salas Francisco Leiva Javier Ruiz-del-Solar OffRL 35 0 0 11 Sep 2024
Points2Plans: From Point Clouds to Long-Horizon Plans with Composable Relational Dynamics Yixuan Huang Christopher Agia Jimmy Wu Tucker Hermans Jeannette Bohg 3DPC 49 1 0 27 Aug 2024
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning Yen-Ru Lai Fu-Chieh Chang Pei-Yuan Wu OffRL 81 1 0 22 Aug 2024
The Evolution of Reinforcement Learning in Quantitative Finance: A Survey Nikolaos Pippas Cagatay Turkay Elliot A. Ludvig AIFin 95 3 0 20 Aug 2024
Answerability Fields: Answerable Location Estimation via Diffusion Models Daich Azuma Taiki Miyanishi Shuhei Kurita Koya Sakamoto M. Kawanabe DiffM 48 0 0 26 Jul 2024
GET-Zero: Graph Embodiment Transformer for Zero-shot Embodiment Generalization Austin Patel Shuran Song LM&Ro 42 5 0 20 Jul 2024
Robotic Control via Embodied Chain-of-Thought Reasoning Michał Zawalski William Chen Karl Pertsch Oier Mees Chelsea Finn Sergey Levine LRM LM&Ro 44 60 0 11 Jul 2024
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation Jiaming Zhou Teli Ma Kun-Yu Lin Ronghe Qiu Zifan Wang Junwei Liang 57 5 0 20 Jun 2024
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning Utsav Singh Pramit Bhattacharyya Vinay P. Namboodiri LM&Ro 47 1 0 09 Jun 2024
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories Qianlan Yang Yu-Xiong Wang OnRL 42 1 0 06 Jun 2024
Data Efficient Behavior Cloning for Fine Manipulation via Continuity-based Corrective Labels Abhay Deshpande Liyiming Ke Quinn Pfeifer Abhishek Gupta S. Srinivasa 47 1 0 29 May 2024
iVideoGPT: Interactive VideoGPTs are Scalable World Models Jialong Wu Shaofeng Yin Ningya Feng Xu He Dong Li Haifeng Zhang Mingsheng Long VGen 54 26 0 24 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 82 45 0 23 May 2024
Learning Future Representation with Synthetic Observations for Sample-efficient Reinforcement Learning Xin Liu Yaran Chen Dong Zhao 47 1 0 20 May 2024
On Robust Reinforcement Learning with Lipschitz-Bounded Policy Networks Nicholas H. Barbara Ruigang Wang I. Manchester 45 4 0 19 May 2024
Policy Learning with a Language Bottleneck Megha Srivastava Cédric Colas Dorsa Sadigh Jacob Andreas 48 3 0 07 May 2024
DPO: A Differential and Pointwise Control Approach to Reinforcement Learning Minh Nguyen Chandrajit Bajaj 25 0 0 24 Apr 2024
Rank2Reward: Learning Shaped Reward Functions from Passive Video Daniel Yang Davin Tjia Jacob Berg Dima Damen Pulkit Agrawal Abhishek Gupta OffRL 40 5 0 23 Apr 2024