TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking
Styles

TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles

1 April 2023

Changjie Fan

Papers citing "TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles"

13 / 13 papers shown

Title
Model See Model Do: Speech-Driven Facial Animation with Style Control Yifang Pan Karan Singh Luiz Gustavo Hafemann DiffM 57 0 0 02 May 2025
CustomListener: Text-guided Responsive Interaction for User-friendly Listening Head Generation Xi Liu Ying Guo Cheng Zhen Tong Li Yingying Ao Pengfei Yan DiffM 49 3 0 01 Mar 2024
Neural Text to Articulate Talk: Deep Text to Audiovisual Speech Synthesis achieving both Auditory and Photo-realism Georgios Milis P. Filntisis A. Roussos Petros Maragos CVBM 41 2 0 11 Dec 2023
From Pixels to Portraits: A Comprehensive Survey of Talking Head Generation Techniques and Applications Shreyank N. Gowda Dheeraj Pandey Shashank Narayana Gowda 54 3 0 30 Aug 2023
High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space Learning Chao Xu Sijun Tan Jibang Wu Yue Han Wenqing Chu Xiaohui Bei Chengjie Wang Haifeng Xu Yong Liu CVBM 54 36 0 04 May 2023
StyleTalk: One-shot Talking Head Generation with Controllable Speaking Styles Yifeng Ma Suzhe Wang Zhipeng Hu Changjie Fan Tangjie Lv Yu-qiong Ding Zhidong Deng Xin Yu 64 83 0 03 Jan 2023
Facial Action Unit Detection and Intensity Estimation from Self-supervised Representation Bowen Ma Rudong An Wei Zhang Yu-qiong Ding Zeng Zhao Rongsheng Zhang Tangjie Lv Changjie Fan Zhipeng Hu CVBM 62 19 0 28 Oct 2022
EAMM: One-Shot Emotional Talking Face via Audio-Based Emotion-Aware Motion Model Xinya Ji Hang Zhou Kaisiyuan Wang Qianyi Wu Wayne Wu Feng Xu Xun Cao CVBM 63 157 0 30 May 2022
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers Wenyi Hong Ming Ding Wendi Zheng Xinghan Liu Jie Tang DiffM 258 571 0 29 May 2022
One-shot Talking Face Generation from Single-speaker Audio-Visual Correlation Learning Suzhe Wang Lincheng Li Yueqing Ding Xin Yu CVBM 76 117 0 06 Dec 2021
PIRenderer: Controllable Portrait Image Generation via Semantic Neural Rendering Yurui Ren Gezhong Li Yuanqi Chen Thomas H. Li Shan Liu DiffM VGen 49 225 0 17 Sep 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 257 4,816 0 24 Feb 2021
VoxCeleb2: Deep Speaker Recognition Joon Son Chung Arsha Nagrani Andrew Zisserman 266 2,242 0 14 Jun 2018