Title
Co-Speech Gesture and Facial Expression Generation for Non-Photorealistic 3D Characters Taisei Omine Naoyuki Kawabata Fuminori Homma SLR 12 0 0 19 Jun 2025
Speaking Beyond Language: A Large-Scale Multimodal Dataset for Learning Nonverbal Cues from Video-Grounded Dialogues Youngmin Kim Jiwan Chung Jisoo Kim Sunghyun Lee Sangkyu Lee Junhyeok Kim Cheoljong Yang Youngjae Yu VGen 35 0 0 01 Jun 2025
MotionPersona: Characteristics-aware Locomotion Control Mingyi Shi Wei Liu Jidong Mei Wangpok Tse Rui Chen Xuelin Chen Taku Komura VGen 38 0 0 30 May 2025
Wav2Sem: Plug-and-Play Audio Semantic Decoupling for 3D Speech-Driven Facial Animation Hao Li Ju Dai Xin Zhao Feng Zhou Junjun Pan Lei Li 28 0 0 29 May 2025
MMGT: Motion Mask Guided Two-Stage Network for Co-Speech Gesture Video Generation Siyuan Wang Jiawei Liu Wei Wang Yeying Jin Jinsong Du Zhi Han SLR VGen 81 0 0 29 May 2025
IKMo: Image-Keyframed Motion Generation with Trajectory-Pose Conditioned Motion Diffusion Model Yang Zhao Yan Zhang Xubo Yang VGen 37 0 0 27 May 2025
AsynFusion: Towards Asynchronous Latent Consistency Models for Decoupled Whole-Body Audio-Driven Avatars T. Zhang Jian Zhao Yuer Li Zheng Zhu Ping Hu Zhaoxin Fan Wenjun Wu Xuelong Li 60 0 0 21 May 2025
$Co$^{3}$Gesture: Towards Coherent Concurrent Co-speech 3D Gesture Generation with Interactive Diffusion$ Co $^{3}$ Gesture: Towards Coherent Concurrent Co-speech 3D Gesture Generation with Interactive Diffusion Xingqun Qi Yatian Wang Hengyuan Zhang J. Pan Wei Xue Shanghang Zhang Wenhan Luo Qifeng Liu Yike Guo SLR 133 0 0 03 May 2025
EchoMask: Speech-Queried Attention-based Mask Modeling for Holistic Co-Speech Motion Generation Xiangyue Zhang Jianfang Li Jiaxu Zhang Jianqiang Ren Liefeng Bo Zhigang Tu 89 0 0 12 Apr 2025
SocialGen: Modeling Multi-Human Social Interaction with Language Models Heng Yu Juze Zhang Changan Chen Tiange Xiang Yusu Fang Juan Carlos Niebles Ehsan Adeli VGen 93 1 0 28 Mar 2025
ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer Yong Xie Yunlian Sun Hongwen Zhang Yebin Liu Jinhui Tang VGen 152 0 0 27 Mar 2025
Video Motion Graphs Haiyang Liu Zhan Xu Fa-Ting Hong Hsin-Ping Huang Yi Zhou Yang Zhou DiffM VGen 161 1 0 26 Mar 2025
GenM $^3$ : Generative Pretrained Multi-path Motion Model for Text Conditional Human Motion Generation Junyu Shi Lijiang Liu Yong Sun Zhiyuan Zhang Jinni Zhou Qiang Nie 99 0 0 19 Mar 2025
MAG: Multi-Modal Aligned Autoregressive Co-Speech Gesture Generation without Vector Quantization Binjie Liu Lina Liu Sanyi Zhang Songen Gu Yihao Zhi Tianyi Zhu Lei Yang Long Ye SLR 111 0 0 18 Mar 2025
Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion Evgeniia Vu Andrei Boiarov Dmitry Vetrov VGen 122 0 0 13 Mar 2025
Cosh-DiT: Co-Speech Gesture Video Synthesis via Hybrid Audio-Visual Diffusion Transformers Yasheng Sun Zhiliang Xu Hang Zhou Jiazhi Guan Quanwei Yang ... Yingying Li Haocheng Feng Jiadong Wang Ziwei Liu Koike Hideki VGen 115 0 0 13 Mar 2025
Enhancing Spoken Discourse Modeling in Language Models Using Gestural Cues Varsha Suresh Muhammad Hamza Mughal Christian Theobalt Vera Demberg 90 0 0 05 Mar 2025
HOP: Heterogeneous Topology-based Multimodal Entanglement for Co-Speech Gesture Generation Hongye Cheng Tianyu Wang Guangsi Shi Zexing Zhao Yanwei Fu SLR 86 1 0 03 Mar 2025
Human-like Nonverbal Behavior with MetaHumans in Real-World Interaction Studies: An Architecture Using Generative Methods and Motion Capture Oliver Chojnowski Alexander Eberhard Michael Schiffmann Ana Müller Anja Richert AI4CE 117 1 0 18 Jan 2025
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters S. Hogue Chenxu Zhang Yapeng Tian Xiaohu Guo DiffM 139 0 0 18 Dec 2024
The Language of Motion: Unifying Verbal and Non-verbal Language of 3D Human Motion Changan Chen Juze Zhang S. K. Lakshmikanth Yusu Fang Ruizhi Shao Gordon Wetzstein L. Fei-Fei Ehsan Adeli VGen 135 5 0 13 Dec 2024
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding Jungbin Cho Junwan Kim Jisoo Kim Minseo Kim Mingu Kang S. Hong Tae-Hyun Oh Youngjae Yu VGen 160 1 0 29 Nov 2024
Towards a GENEA Leaderboard -- an Extended, Living Benchmark for Evaluating and Advancing Conversational Motion Synthesis Rajmund Nagy Hendric Voss Youngwoo Yoon Taras Kucherenko Teodor Nikolov Thanh Hoang-Minh R. Mcdonnell Stefan Kopp Michael Neff G. Henter 62 1 0 08 Oct 2024
Diverse Code Query Learning for Speech-Driven Facial Animation Chunzhi Gu Shigeru Kuriyama Katsuya Hotta DiffM 68 0 0 27 Sep 2024
ProbTalk3D: Non-Deterministic Emotion Controllable Speech-Driven 3D Facial Animation Synthesis Using VQ-VAE Sichun Wu Kazi Injamamul Haque Zerrin Yumak VGen 100 2 0 12 Sep 2024
DEEPTalk: Dynamic Emotion Embedding for Probabilistic Speech-Driven 3D Face Animation Jisoo Kim Jungbin Cho Joonho Park Soonmin Hwang Da Eun Kim Geon Kim Youngjae Yu 142 1 0 12 Aug 2024
MotionCraft: Crafting Whole-Body Motion with Plug-and-Play Multimodal Controls Hao Wang Ailing Zeng Xu Ju Xian Liu Zhaoyang Zhang Wei Liu Qiang Xu VGen DiffM 89 4 0 30 Jul 2024
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models Zunnan Xu Yukang Lin Haonan Han Sicheng Yang Ronghui Li Yachao Zhang Xiu Li Mamba 160 26 0 14 Mar 2024
Video Understanding with Large Language Models: A Survey Yunlong Tang Jing Bi Siting Xu Luchuan Song Susan Liang ... Feng Zheng Jianguo Zhang Chenliang Xu Jiebo Luo Chenliang Xu VLM 222 100 0 29 Dec 2023
Emotional Speech-driven 3D Body Animation via Disentangled Latent Diffusion Kiran Chhatre Radek Danvevcek Nikos Athanasiou Giorgio Becherini Christopher Peters Michael J. Black Timo Bolkart DiffM 132 22 0 07 Dec 2023