Guiding Pretraining in Reinforcement Learning with Large Language Models

13 February 2023

Pieter Abbeel

Abhishek Gupta

Jacob Andreas

LM&Ro

ArXiv PDF HTML

Papers citing "Guiding Pretraining in Reinforcement Learning with Large Language Models"

25 / 25 papers shown

Title
HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving Zhiwen Chen Bo Leng Zhuoren Li Hanming Deng Guizhe Jin Ran Yu Huanxi Wen 109 0 0 21 May 2025
Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition Bo Yue Shuqi Guo Kaiyu Hu Chujiao Wang Benyou Wang Kui Jia Guiliang Liu LRM 60 0 0 16 May 2025
Reward Generation via Large Vision-Language Model in Offline Reinforcement Learning Younghwan Lee Tung M. Luu Donghoon Lee Chang D. Yoo 3DV VLM OffRL 79 0 0 03 Apr 2025
Intrinsically-Motivated Humans and Agents in Open-World Exploration Aly Lidayan Yuqing Du Eliza Kosoy Maria Rufova Pieter Abbeel Alison Gopnik 72 1 0 31 Mar 2025
An Overview and Discussion on Using Large Language Models for Implementation Generation of Solutions to Open-Ended Problems Hashmath Shaik Alex Doboli OffRL ELM 331 0 0 31 Dec 2024
CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation Jie Liu Pan Zhou Yingjun Du Ah-Hwee Tan Cees G. M. Snoek Jan-Jakob Sonke E. Gavves LLMAG 55 2 0 07 Nov 2024
On Bits and Bandits: Quantifying the Regret-Information Trade-off Itai Shufaro Nadav Merlis Nir Weinberger Shie Mannor 94 0 0 26 May 2024
A Survey on Large Language Model-Based Game Agents Sihao Hu Tiansheng Huang Gaowen Liu Ramana Rao Kompella Gaowen Liu Selim Furkan Tekin Yichang Xu Zachary Yahn Ling Liu LLMAG LM&Ro AI4CE LM&MA 88 55 0 02 Apr 2024
ExploRLLM: Guiding Exploration in Reinforcement Learning with Large Language Models Runyu Ma Jelle Luijkx Zlatan Ajanović Jens Kober LM&Ro LRM 51 9 0 14 Mar 2024
Exploration in Deep Reinforcement Learning: A Survey Pawel Ladosz Lilian Weng Minwoo Kim H. Oh OffRL 45 334 0 02 May 2022
Flamingo: a Visual Language Model for Few-Shot Learning Jean-Baptiste Alayrac Jeff Donahue Pauline Luc Antoine Miech Iain Barr ... Mikolaj Binkowski Ricardo Barreira Oriol Vinyals Andrew Zisserman Karen Simonyan MLLM VLM 268 3,458 0 29 Apr 2022
Do As I Can, Not As I Say: Grounding Language in Robotic Affordances Michael Ahn Anthony Brohan Noah Brown Yevgen Chebotar Omar Cortes ... Ted Xiao Peng Xu Sichun Xu Mengyuan Yan Andy Zeng LM&Ro 105 1,901 0 04 Apr 2022
A Survey of Modern Deep Learning based Object Detection Models Syed Sahil Abbas Zaidi M. S. Ansari Asra Aslam N. Kanwal M. Asghar Brian Lee VLM ObjD 107 740 0 24 Apr 2021
Behavior From the Void: Unsupervised Active Pre-Training Hao Liu Pieter Abbeel VLM SSL 59 196 0 08 Mar 2021
Persistent Anti-Muslim Bias in Large Language Models Abubakar Abid Maheen Farooqi James Zou AILaw 70 545 0 14 Jan 2021
Autotelic Agents with Intrinsically Motivated Goal-Conditioned Reinforcement Learning: a Short Survey Cédric Colas Tristan Karch Olivier Sigaud Pierre-Yves Oudeyer 81 87 0 17 Dec 2020
Environmental drivers of systematicity and generalization in a situated agent Felix Hill Andrew Kyle Lampinen R. Schneider S. Clark M. Botvinick James L. McClelland Adam Santoro OOD 50 105 0 01 Oct 2019
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 540 11,979 0 27 Aug 2019
A survey on intrinsic motivation in reinforcement learning A. Aubret L. Matignon S. Hassas AI4CE 43 143 0 19 Aug 2019
A Survey of Reinforcement Learning Informed by Natural Language Jelena Luketina Nantas Nardelli Gregory Farquhar Jakob N. Foerster Jacob Andreas Edward Grefenstette Shimon Whiteson Tim Rocktaschel LM&Ro KELM OffRL LRM 62 279 0 10 Jun 2019
Human Action Recognition and Prediction: A Survey Yu Kong Y. Fu 61 614 0 28 Jun 2018
The Surprising Creativity of Digital Evolution: A Collection of Anecdotes from the Evolutionary Computation and Artificial Life Research Communities Joel Lehman Jeff Clune D. Misevic C. Adami L. Altenberg ... Danesh Tarapore S. Thibault Westley Weimer R. Watson Jason Yosinksi 97 279 0 09 Mar 2018
GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms Cédric Colas Olivier Sigaud Pierre-Yves Oudeyer 45 158 0 14 Feb 2018
Curiosity-driven Exploration by Self-supervised Prediction Deepak Pathak Pulkit Agrawal Alexei A. Efros Trevor Darrell LRM SSL 93 2,416 0 15 May 2017
Deep Reinforcement Learning with Double Q-learning H. V. Hasselt A. Guez David Silver OffRL 123 7,590 0 22 Sep 2015