DiaTool-DPO: Multi-Turn Direct Preference Optimization for Tool-Augmented Large Language Models

2 April 2025

Papers citing "DiaTool-DPO: Multi-Turn Direct Preference Optimization for Tool-Augmented Large Language Models"

2 / 2 papers shown

Title
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities Jiarui Lu Thomas Holleis Yizhe Zhang Bernhard Aumayer Feng Nan ... Shen Ma Mengyu Li Guoli Yin Zirui Wang Ruoming Pang LLMAG ELM 110 39 0 08 Aug 2024
Can Tool-augmented Large Language Models be Aware of Incomplete Conditions? Seungbin Yang Yujin Baek Taehee Kim Jaegul Choo 82 2 0 18 Jun 2024