MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models

14 March 2024

Papers citing "MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models"

50 / 84 papers shown

Title
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation Yukang Lin Y. Hong Zunnan Xu Xiaochen Li Chao Xu ... Jun Lan Huijia Zhu Weiqiang Wang Jianfu Zhang Xiu Li VGen 67 0 0 15 Apr 2025
Separate to Collaborate: Dual-Stream Diffusion Model for Coordinated Piano Hand Motion Synthesis Zihao Liu Mingwen Ou Zunnan Xu Jiaqi Huang Haonan Han Ronghui Li Xiaochen Li DiffM 71 0 0 14 Apr 2025
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation Fa-Ting Hong Zunnan Xu Zixiang Zhou Zhiqiang Zhang Xiu Li Qin Lin Qinglin Lu D. Xu DiffM VGen 103 3 0 03 Apr 2025
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation Siqi Zhang Yanyuan Qiao Qunbo Wang Zike Yan Qi Wu Zhihua Wei Qingbin Liu 119 0 0 31 Mar 2025
FireEdit: Fine-grained Instruction-based Image Editing via Region-aware Vision Language Model Zhiqiang Zhang Jia-Nan Li Zunnan Xu Hanhui Li Yiji Cheng Fa-Ting Hong Qin Lin Qinglin Lu Xiaodan Liang DiffM 100 2 0 25 Mar 2025
MVPortrait: Text-Guided Motion and Emotion Control for Multi-view Vivid Portrait Animation Yukang Lin Hokit Fung Jianjin Xu Zeping Ren Adela S.M. Lau Guosheng Yin Xiu Li VGen 74 6 0 25 Mar 2025
HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation Zunnan Xu Zhentao Yu Zixiang Zhou Jun Zhou Xiaoyu Jin ... Chengfei Cai Shiyu Tang Qin Lin Xiu Li Qinglin Lu DiffM VGen 102 10 0 24 Mar 2025
ExGes: Expressive Human Motion Retrieval and Modulation for Audio-Driven Gesture Synthesis Xukun Zhou Fengxin Li Ming Chen Yan Zhou Pengfei Wan Di Zhang Yeying Jin Zhaoxin Fan Hongyan Liu Jun He DiffM VGen 77 0 0 09 Mar 2025
SlerpFace: Face Template Protection via Spherical Linear Interpolation Zhizhou Zhong Yuxi Mi Yanhua Huang Jianqing Xu Guodong Mu Shouhong Ding Jingyun Zhang Rizen Guo Yunsheng Wu Shuigeng Zhou AAML PICV 97 5 0 03 Jan 2025
VMamba: Visual State Space Model Yue Liu Yunjie Tian Yuzhong Zhao Hongtian Yu Lingxi Xie Yaowei Wang Qixiang Ye Jianbin Jiao Yunfan Liu Mamba 250 686 0 31 Dec 2024
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation Xiaoyu Jin Zunnan Xu Mingwen Ou Wenming Yang DiffM 64 7 0 29 Aug 2024
MambaCSR: Dual-Interleaved Scanning for Compressed Image Super-Resolution With SSMs Yulin Ren Xin Li Mengxi Guo Bingchen Li Shijie Zhao Zhibo Chen Mamba 80 6 0 21 Aug 2024
JambaTalk: Speech-Driven 3D Talking Head Generation Based on Hybrid Transformer-Mamba Language Model Farzaneh Jafari Stefano Berretti Anup Basu Mamba 56 1 0 03 Aug 2024
Venturing into Uncharted Waters: The Navigation Compass from Transformer to Mamba Yuchen Zou Yineng Chen Zuchao Li Lefei Zhang Hai Zhao 91 1 0 24 Jun 2024
Diffusion Models in Low-Level Vision: A Survey Chunming He Yuqi Shen Chengyu Fang Fengyang Xiao Longxiang Tang Yulun Zhang W. Zuo Zhenhua Guo Xiu Li VLM DiffM MedIm 111 39 0 17 Jun 2024
Real-world Image Dehazing with Coherence-based Label Generator and Cooperative Unfolding Network Chengyu Fang Chunming He Fengyang Xiao Yulun Zhang Longxiang Tang Yuelin Zhang Kai Li Xiu Li 72 4 0 12 Jun 2024
MVGamba: Unify 3D Content Generation as State Space Sequence Modeling Xuanyu Yi Zike Wu Qiuhong Shen Qingshan Xu Pan Zhou Joo-Hwee Lim Shuicheng Yan Xinchao Wang Hanwang Zhang 96 13 0 10 Jun 2024
GrootVL: Tree Topology is All You Need in State Space Model Yicheng Xiao Lin Song Shaoli Huang Jiangshan Wang Siyu Song Yixiao Ge Xiu Li Ying Shan Mamba 80 11 0 04 Jun 2024
Follow-Your-Emoji: Fine-Controllable and Expressive Freestyle Portrait Animation Yi Ma Hongyu Liu Haobo Wang Heng Pan Yingqing He ... Ailing Zeng Chengfei Cai H. Shum Wen Liu Qifeng Chen 76 53 0 04 Jun 2024
Uncertainty-aware sign language video retrieval with probability distribution modeling Xuan Wu Hongxiang Li Yuanjiang Luo Xuxin Cheng Xianwei Zhuang Meng Cao Keren Fu UQLM SLR 42 5 0 30 May 2024
The Evolution of Multimodal Model Architectures S. Wadekar Abhishek Chaurasia Aman Chadha Eugenio Culurciello 73 17 0 28 May 2024
Vision Mamba: A Comprehensive Survey and Taxonomy Xiao Liu Chenxu Zhang Lei Zhang Mamba 68 31 0 07 May 2024
A Survey on Visual Mamba Hanwei Zhang Ying Zhu Dan Wang Lijun Zhang Tianxiang Chen Zi Ye Mamba 60 63 0 24 Apr 2024
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis Yuxi Ren Xin Xia Yanzuo Lu Jiacheng Zhang Jie Wu Pan Xie Xing Wang Xuefeng Xiao 98 74 0 21 Apr 2024
State Space Model for New-Generation Network Alternative to Transformers: A Survey Tianlin Li Shiao Wang Yuhe Ding Yuehang Li Wentao Wu ... Bowei Jiang Chenglong Li Yaowei Wang Yonghong Tian Jin Tang Mamba 87 52 0 15 Apr 2024
Lodge: A Coarse to Fine Diffusion Network for Long Dance Generation Guided by the Characteristic Dance Primitives Ronghui Li YuXiang Zhang Yachao Zhang Hongwen Zhang Jie Guo Yan Zhang Yebin Liu Xiu Li DiffM 67 32 0 15 Mar 2024
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation Ziyang Wang Jian-Qing Zheng Yichi Zhang Ge Cui Lei Li Mamba 73 134 0 07 Feb 2024
DiffSHEG: A Diffusion-Based Approach for Real-Time Speech-driven Holistic 3D Expression and Gesture Generation Junming Chen Yunfei Liu Jianan Wang Ailing Zeng Yu Li Qifeng Chen VGen 55 32 0 09 Jan 2024
Freetalker: Controllable Speech and Text-Driven Gesture Generation Based on Diffusion Models for Enhanced Speaker Naturalness Sicheng Yang Zunnan Xu Haiwei Xue Yongkang Cheng Shaoli Huang Biwei Huang Zhiyong Wu DiffM VGen 47 11 0 07 Jan 2024
EMAGE: Towards Unified Holistic Co-Speech Gesture Generation via Expressive Masked Audio Gesture Modeling Haiyang Liu Zihao Zhu Giorgio Becherini Yichen Peng Mingyang Su You Zhou Xuefei Zhe Naoya Iwamoto Bo Zheng Michael J. Black SLR 77 35 0 31 Dec 2023
Chain of Generation: Multi-Modal Gesture Synthesis via Cascaded Conditional Control Zunnan Xu Yachao Zhang Sicheng Yang Ronghui Li Xiu Li SLR 67 13 0 26 Dec 2023
Emotional Speech-driven 3D Body Animation via Disentangled Latent Diffusion Kiran Chhatre Radek Danvevcek Nikos Athanasiou Giorgio Becherini Christopher Peters Michael J. Black Timo Bolkart DiffM 83 22 0 07 Dec 2023
Mamba: Linear-Time Sequence Modeling with Selective State Spaces Albert Gu Tri Dao Mamba 126 2,665 0 01 Dec 2023
Consistent123: One Image to Highly Consistent 3D Asset Using Case-Aware Diffusion Priors Yukang Lin Haonan Han Chaoqun Gong Zunnan Xu Yachao Zhang Xiu Li DiffM 41 57 0 29 Sep 2023
UnifiedGesture: A Unified Gesture Synthesis Model for Multiple Skeletons Sicheng Yang Zehao Wang Zhiyong Wu Minglei Li Zhensong Zhang ... Lei Hao Songcen Xu Xiaofei Wu Changpeng Yang Zonghong Dai DiffM 75 14 0 13 Sep 2023
Diffusion-Based Co-Speech Gesture Generation Using Joint Text and Audio Representation Anna Deichler Shivam Mehta Simon Alexanderson Jonas Beskow DiffM 42 24 0 11 Sep 2023
BodyFormer: Semantics-guided 3D Body Gesture Synthesis with Transformer Kunkun Pang Dafei Qin Yingruo Fan Julian Habekost Takaaki Shiratori Junichi Yamagishi Taku Komura SLR ViT 35 19 0 07 Sep 2023
The DiffuseStyleGesture+ entry to the GENEA Challenge 2023 Sicheng Yang Haiwei Xue Zhensong Zhang Minglei Li Zhiyong Wu Xiaofei Wu Songcen Xu Zonghong Dai DiffM 62 15 0 26 Aug 2023
G2L: Semantically Aligned and Uniform Video Grounding via Geodesic and Game Theory Hongxiang Li Meng Cao Xuxin Cheng Yaowei Li Zhihong Zhu Yuexian Zou 62 20 0 26 Jul 2023
Bridging Vision and Language Encoders: Parameter-Efficient Tuning for Referring Image Segmentation Zunnan Xu Zhihong Chen Yong Zhang Yibing Song Xiang Wan Guanbin Li VLM 63 51 0 21 Jul 2023
EMoG: Synthesizing Emotive Co-speech 3D Gesture with Diffusion Model Li-Ping Yin Yijun Wang Tianyu He Jinming Liu Wei Zhao Bohan Li Xin Jin Jianxin Lin DiffM 49 14 0 20 Jun 2023
EmotionGesture: Audio-Driven Diverse Emotional Co-Speech 3D Gesture Generation Xingqun Qi Chen Liu Lincheng Li Jie Hou Haoran Xin Xin Yu SLR 61 30 0 30 May 2023
QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation Sicheng Yang Zhiyong Wu Minglei Li Zhensong Zhang Lei Hao Weihong Bao Hao-Wen Zhuang SLR 67 46 0 18 May 2023
DiffuseStyleGesture: Stylized Audio-Driven Co-Speech Gesture Generation with Diffusion Models Sicheng Yang Zhiyong Wu Minglei Li Zhensong Zhang Lei Hao Weihong Bao Ming Cheng Long Xiao 42 70 0 08 May 2023
AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis Hendric Voss S. Kopp SLR 54 8 0 02 May 2023
Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos Yue Ma Yin-Yin He Xiaodong Cun Xintao Wang Siran Chen Ying Shan Xiu Li Qifeng Chen DiffM VGen 63 183 0 03 Apr 2023
GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents Tenglong Ao Zeyi Zhang Libin Liu DiffM VGen 85 151 0 26 Mar 2023
Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation Lingting Zhu Xian Liu Xuanyu Liu Rui Qian Ziwei Liu Lequan Yu 59 118 0 16 Mar 2023
Co-Speech Gesture Synthesis using Discrete Gesture Token Learning Shuhong Lu Youngwoo Yoon Andrew W. Feng SLR 65 12 0 04 Mar 2023
Exploiting Auxiliary Caption for Video Grounding Hongxiang Li Meng Cao Xuxin Cheng Zhihong Zhu Yaowei Li Yuexian Zou 44 10 0 15 Jan 2023