Towards human-like spoken dialogue generation between AI agents from written dialogue

2 October 2023

Papers citing "Towards human-like spoken dialogue generation between AI agents from written dialogue"

11 / 11 papers shown

Title
CoVoMix2: Advancing Zero-Shot Dialogue Generation with Fully Non-Autoregressive Flow Matching Leying Zhang Y. Qian Xiaofei Wang Manthan Thakker Dongmei Wang ... Haibin Wu Yuxuan Hu Jinyu Li Yanmin Qian Sheng Zhao 52 0 0 01 Jun 2025
SpeechDialogueFactory: Generating High-Quality Speech Dialogue Data to Accelerate Your Speech-LLM Development Minghan Wang Ye Bai Yanjie Wang Thuy-Trang Vu Ehsan Shareghi Gholamreza Haffari 111 0 0 31 Mar 2025
Speculative End-Turn Detector for Efficient Speech Chatbot Assistant Hyunjong Ok Suho Yoo Jaeho Lee 172 0 0 30 Mar 2025
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis Yuto Nishimura Takumi Hirose Masanari Ohi Hideki Nakayama Nakamasa Inoue VLM 115 2 0 06 Oct 2024
Style-Talker: Finetuning Audio Language Model and Style-Based Text-to-Speech Model for Fast Spoken Dialogue Generation Yinghao Aaron Li Xilin Jiang Jordan Darefsky Ge Zhu N. Mesgarani 94 4 0 13 Aug 2024
J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling Wataru Nakata Kentaro Seki Hitomi Yanaka Yuki Saito Shinnosuke Takamichi Hiroshi Saruwatari AuLLM 65 2 0 22 Jul 2024
SPL: A Socratic Playground for Learning Powered by Large Language Model Liang Zhang Jionghao Lin Ziyi Kuang Sheng Xu Mohammed Yeasin Xiangen Hu LLMAG 108 6 0 20 Jun 2024
Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction Haoqiu Yan Yongxin Zhu Kai Zheng Bing Liu Haoyu Cao Deqiang Jiang Linli Xu AuLLM 93 5 0 18 Jun 2024
CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations Leying Zhang Yao Qian Long Zhou Shujie Liu Dongmei Wang ... Yanmin Qian Jinyu Li Lei He Sheng Zhao Michael Zeng 77 2 0 10 Apr 2024
Advancing Large Language Models to Capture Varied Speaking Styles and Respond Properly in Spoken Conversations Guan-Ting Lin Cheng-Han Chiang Hung-yi Lee 113 29 0 20 Feb 2024
SpeechAgents: Human-Communication Simulation with Multi-Modal Multi-Agent Systems Dong Zhang Zhaowei Li Pengyu Wang Xin Zhang Yaqian Zhou Xipeng Qiu LLMAG 67 2 0 08 Jan 2024