Eureka: Human-Level Reward Design via Coding Large Language Models

19 October 2023

De-An Huang

Linxi Fan

Papers citing "Eureka: Human-Level Reward Design via Coding Large Language Models"

23 / 73 papers shown

Title
Efficient Evolutionary Search Over Chemical Space with Large Language Models Haorui Wang Marta Skreta C. Ser Wenhao Gao Lingkai Kong ... Yanqiao Zhu Yuanqi Du Alán Aspuru-Guzik Kirill Neklyudov Chao Zhang 47 12 0 23 Jun 2024
FreeMotion: MoCap-Free Human Motion Synthesis with Multimodal Large Language Models Zhikai Zhang Yitang Li Haofeng Huang Mingxian Lin Li Yi 49 2 0 15 Jun 2024
DAG-Plan: Generating Directed Acyclic Dependency Graphs for Dual-Arm Cooperative Planning Zeyu Gao Yao Mu Jinye Qu Mengkang Hu Lingyue Guo Ping Luo Yanfeng Lu Ping Luo Shanghang Zhang Yanfeng Lu 54 10 0 14 Jun 2024
Discovering Preference Optimization Algorithms with and for Large Language Models Chris Xiaoxuan Lu Samuel Holt Claudio Fanconi Alex J. Chan Jakob Foerster M. Schaar R. T. Lange OffRL 37 15 0 12 Jun 2024
The BiGGen Bench: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models Seungone Kim Juyoung Suk Ji Yong Cho Shayne Longpre Chaeeun Kim ... Sean Welleck Graham Neubig Moontae Lee Kyungjae Lee Minjoon Seo ELM ALM LM&MA 102 31 0 09 Jun 2024
Language Guided Skill Discovery Seungeun Rho Laura Smith Tianyu Li Sergey Levine Xue Bin Peng Sehoon Ha LM&Ro 42 4 0 07 Jun 2024
Robo-Instruct: Simulator-Augmented Instruction Alignment For Finetuning Code LLMs Zichao Hu Junyi Jessy Li Arjun Guha Joydeep Biswas SyDa ALM 51 1 0 30 May 2024
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration Yang Zhang Shixin Yang Chenjia Bai Fei Wu Xiu Li Zhen Wang Xuelong Li LLMAG 36 25 0 23 May 2024
Learning Reward for Robot Skills Using Large Language Models via Self-Alignment Yuwei Zeng Yao Mu Lin Shao 42 12 0 12 May 2024
SuFIA: Language-Guided Augmented Dexterity for Robotic Surgical Assistants Masoud Moghani Lars Doorenbos Will Panitch Sean Huver Mahdi Azizian Ken Goldberg Animesh Garg 35 9 0 08 May 2024
Enhancing Q-Learning with Large Language Model Heuristics Xiefeng Wu LRM 32 0 0 06 May 2024
A Survey on Large Language Model-Based Game Agents Sihao Hu Tiansheng Huang Gaowen Liu Ramana Rao Kompella Gaowen Liu Selim Furkan Tekin Yichang Xu Zachary Yahn Ling Liu LLMAG LM&Ro AI4CE LM&MA 71 51 0 02 Apr 2024
Context-aware LLM-based Safe Control Against Latent Risks Quang Khanh Luu Xiyu Deng Anh Van Ho Yorie Nakahira 54 4 0 18 Mar 2024
ExploRLLM: Guiding Exploration in Reinforcement Learning with Large Language Models Runyu Ma Jelle Luijkx Zlatan Ajanović Jens Kober LM&Ro LRM 38 7 0 14 Mar 2024
Practice Makes Perfect: Planning to Learn Skill Parameter Policies Nishanth Kumar Tom Silver Willie McClinton Linfeng Zhao Stephen Proulx Tomás Lozano-Pérez L. Kaelbling Jennifer Barry 55 18 0 22 Feb 2024
AutoSAT: Automatically Optimize SAT Solvers via Large Language Models Yiwen Sun Xianyin Zhang Shiyu Huang Shaowei Cai Bing-Zhen Zhang Ke Wei 32 2 0 16 Feb 2024
Towards Unified Alignment Between Agents, Humans, and Environment Zonghan Yang An Liu Zijun Liu Kai Liu Fangzhou Xiong ... Zhenhe Zhang Fuwen Luo Zhicheng Guo Peng Li Yang Liu 32 4 0 12 Feb 2024
The RL/LLM Taxonomy Tree: Reviewing Synergies Between Reinforcement Learning and Large Language Models M. Pternea Prerna Singh Abir Chakraborty Y. Oruganti M. Milletarí Sayli Bapat Kebei Jiang OffRL 21 7 0 02 Feb 2024
When Large Language Models Meet Evolutionary Algorithms: Potential Enhancements and Challenges Wang Chao Jiaxuan Zhao Licheng Jiao Lingling Li Fang Liu Shuyuan Yang 75 13 0 19 Jan 2024
Vision-Language Models as a Source of Rewards Kate Baumli Satinder Baveja Feryal M. P. Behbahani Harris Chan Gheorghe Comanici ... Yannick Schroecker Stephen Spencer Richie Steigerwald Luyu Wang Lei Zhang VLM LRM 42 26 0 14 Dec 2023
Vision-Language Models as Success Detectors Yuqing Du Ksenia Konyushkova Misha Denil A. Raju Jessica Landon Felix Hill Nando de Freitas Serkan Cabi MLLM LRM 91 77 0 13 Mar 2023
ProgPrompt: Generating Situated Robot Task Plans using Large Language Models Ishika Singh Valts Blukis Arsalan Mousavian Ankit Goyal Danfei Xu Jonathan Tremblay D. Fox Jesse Thomason Animesh Garg LM&Ro LLMAG 120 624 0 22 Sep 2022
Reward (Mis)design for Autonomous Driving W. B. Knox A. Allievi Holger Banzhaf Felix Schmitt Peter Stone 83 113 0 28 Apr 2021