LLF-Bench: Benchmark for Interactive Learning from Language Feedback

LLF-Bench: Benchmark for Interactive Learning from Language Feedback

11 December 2023

Dipendra Kumar Misra

Adith Swaminathan

Papers citing "LLF-Bench: Benchmark for Interactive Learning from Language Feedback"

19 / 19 papers shown

Title
Survey on Evaluation of LLM-based Agents Asaf Yehudai Lilach Eden Alan Li Guy Uziel Yilun Zhao Roy Bar-Haim Arman Cohan Michal Shmueli-Scheuer LLMAG ELM Presented at ResearchTrend Connect \| LLMAG on 07 May 2025 95 7 0 20 Mar 2025
SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks Yifei Zhou Song Jiang Yuandong Tian Jason Weston Sergey Levine Sainbayar Sukhbaatar Xian Li LLMAG LRM 59 3 0 19 Mar 2025
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use Jiajun Xi Yinong He Jianing Yang Yinpei Dai Joyce Chai LM&Ro 24 2 0 31 Oct 2024
Beyond Prompts: Dynamic Conversational Benchmarking of Large Language Models David Castillo-Bolado Joseph Davidson Finlay Gray Marek Rosa 34 3 0 30 Sep 2024
A Survey on Complex Tasks for Goal-Directed Interactive Agents Mareike Hartmann Alexander Koller LM&Ro LLMAG 34 0 0 27 Sep 2024
Learning Goal-Conditioned Representations for Language Reward Models Vaskar Nath Dylan Slack Jeff Da Yuntao Ma Hugh Zhang Spencer Whitehead Sean Hendryx 24 0 0 18 Jul 2024
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models Pengxiang Li Zhi Gao Bofei Zhang Tao Yuan Yuwei Wu Mehrtash Harandi Yunde Jia Song-Chun Zhu Qing Li VLM MLLM 45 3 0 16 Jul 2024
AI Agents That Matter Sayash Kapoor Benedikt Stroebl Zachary S. Siegel Nitya Nadgir Arvind Narayanan 49 37 0 01 Jul 2024
Trace is the New AutoDiff -- Unlocking Efficient Optimization of Computational Workflows Ching-An Cheng Allen Nie Adith Swaminathan AI4CE 31 12 0 23 Jun 2024
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought Gabriel H. Sarch Lawrence Jang Michael J. Tarr William W. Cohen Kenneth Marino Katerina Fragkiadaki LLMAG 50 8 0 20 Jun 2024
On Overcoming Miscalibrated Conversational Priors in LLM-based Chatbots Christine Herlihy Jennifer Neville Tobias Schnabel Adith Swaminathan 36 3 0 01 Jun 2024
Aligning LLM Agents by Learning Latent Preference from User Edits Ge Gao Alexey Taymanov Eduardo Salinas Paul Mineiro Dipendra Kumar Misra LLMAG 37 27 0 23 Apr 2024
Tur[k]ingBench: A Challenge Benchmark for Web Agents Kevin Xu Yeganeh Kordi Kate Sanders Yizhong Wang Adam Byerly Kate Sanders Adam Byerly Jingyu Zhang Benjamin Van Durme Daniel Khashabi LLMAG 72 6 0 18 Mar 2024
Reflect-RL: Two-Player Online RL Fine-Tuning for LMs Runlong Zhou Simon S. Du Beibin Li OffRL 47 3 0 20 Feb 2024
Natural Language Reinforcement Learning Xidong Feng Bo Liu Girish A. Koushik Ziyan Wang Girish A. Koushiks Yali Du Ying Wen Jun Wang OffRL 35 3 0 11 Feb 2024
MINT: Evaluating LLMs in Multi-turn Interaction with Tools and Language Feedback Xingyao Wang Zihan Wang Jiateng Liu Yangyi Chen Lifan Yuan Hao Peng Heng Ji LRM 130 141 0 19 Sep 2023
Ask Me Anything: A simple strategy for prompting language models Simran Arora A. Narayan Mayee F. Chen Laurel J. Orr Neel Guha Kush S. Bhatia Ines Chami Frederic Sala Christopher Ré ReLM LRM 211 207 0 05 Oct 2022
Interactive Learning from Activity Description Khanh Nguyen Dipendra Kumar Misra Robert Schapire Miroslav Dudík Patrick Shafto 47 34 0 13 Feb 2021
Grounding Language to Entities and Dynamics for Generalization in Reinforcement Learning H. Wang Victor Zhong Karthik Narasimhan 81 53 0 19 Jan 2021