StoryGAN: A Sequential Conditional GAN for Story Visualization

6 December 2018

Lawrence Carin

David Carlson

Jianfeng Gao

ArXiv PDF HTML

Papers citing "StoryGAN: A Sequential Conditional GAN for Story Visualization"

50 / 121 papers shown

Title
CineVerse: Consistent Keyframe Synthesis for Cinematic Scene Composition Quynh Phung Long Mai Fabian Caba Heilbron Feng Liu Jia-Bin Huang Cusuh Ham DiffM VGen CoGe 111 0 0 28 Apr 2025
One-Minute Video Generation with Test-Time Training Karan Dalal Daniel Koceja Gashon Hussein Jiarui Xu Yue Zhao ... Tatsunori Hashimoto Sanmi Koyejo Yejin Choi Yu Sun Xiaolong Wang ViT 91 4 0 07 Apr 2025
Consistent Subject Generation via Contrastive Instantiated Concepts Lee Hsin-Ying Kelvin Chan Ming Yang DiffM 95 0 0 31 Mar 2025
Object Isolated Attention for Consistent Story Visualization Xiangyang Luo Junhao Cheng Yifan Xie Xin Zhang Tao Feng Ziqiang Liu Fei Ma Fei Richard Yu DiffM 50 1 0 30 Mar 2025
Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization Iñigo Pikabea Iñaki Lacunza Oriol Pareras Carlos Escolano Aitor Gonzalez-Agirre Javier Hernando Marta Villegas VLM 54 0 0 28 Mar 2025
Synthetic Video Enhances Physical Fidelity in Video Synthesis Qi Zhao Xingyu Ni Ziyu Wang Feng Cheng Ziyan Yang Lu Jiang Bohan Wang VGen 47 2 0 26 Mar 2025
Automated Movie Generation via Multi-Agent CoT Planning Weijia Wu Zeyu Zhu Mike Zheng Shou VGen 80 2 0 10 Mar 2025
Text2Story: Advancing Video Storytelling with Text Guidance Taewon Kang D. Kothandaraman Ming C. Lin DiffM VGen 59 0 0 08 Mar 2025
Rebalancing the Scales: A Systematic Mapping Study of Generative Adversarial Networks (GANs) in Addressing Data Imbalance Pankaj Yadav Gulshan Sihag Vivek Vijay AI4CE 34 0 0 23 Feb 2025
Artificial Intelligence for Biomedical Video Generation Linyuan Li Jianing Qiu Anujit Saha Lin Li Poyuan Li Mengxian He Ziyu Guo Wu Yuan VGen 63 1 0 12 Nov 2024
StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration Panwen Hu Jin Jiang Jianqi Chen Mingfei Han Shengcai Liao Xiaojun Chang Xiaodan Liang VGen DiffM 43 5 0 07 Nov 2024
KAHANI: Culturally-Nuanced Visual Storytelling Tool for Non-Western Cultures Hamna Deepthi Sudharsan Agrima Seth Ritvik Budhiraja Deepika Khullar Vyshak Jain Kalika Bali Aditya Vashistha Sameer Segal DiffM 39 0 0 25 Oct 2024
"Confrontation or Acceptance": Understanding Novice Visual Artists' Perception towards AI-assisted Art Creation Shuning Zhang Shixuan Li 33 1 0 19 Oct 2024
Story-Adapter: A Training-free Iterative Framework for Long Story Visualization Jiawei Mao Xiaoke Huang Yunfei Xie Yuanqi Chang Mude Hui Bingjie Xu Yuyin Zhou VGen DiffM 43 0 0 08 Oct 2024
ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database Anyi Rao Jean-Peic Chou Maneesh Agrawala VGen 28 2 0 04 Oct 2024
One missing piece in Vision and Language: A Survey on Comics Understanding Emanuele Vivoli Andrey Barsky Mohamed Ali Souibgui Artemis LLabres Marco Bertini Dimosthenis Karatzas 42 3 0 14 Sep 2024
What Makes a Good Story and How Can We Measure It? A Comprehensive Survey of Story Evaluation Dingyi Yang Qin Jin 44 5 0 26 Aug 2024
Anim-Director: A Large Multimodal Model Powered Agent for Controllable Animation Video Generation Yunxin Li Haoyuan Shi Baotian Hu Longyue Wang Jiashun Zhu Jinyi Xu Zhen Zhao Min Zhang VGen 48 5 0 19 Aug 2024
DataNarrative: Automated Data-Driven Storytelling with Visualizations and Texts Mohammed Saidul Islam Md Tahmid Rahman Laskar Md. Rizwan Parvez Enamul Hoque Chenyu You DiffM 39 6 0 09 Aug 2024
Survey: Transformer-based Models in Data Modality Conversion Elyas Rashno Amir Eskandari Aman Anand F. Zulkernine MedIm 35 0 0 08 Aug 2024
Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling Zilyu Ye Yu Lei Ruotian Peng Jinjin Cao Zhiyang Chen ... Mingyuan Zhou Xiaoqian Shen Mohamed Elhoseiny Nan Zhuang Guo-Jun Qi VGen VLM 40 1 0 07 Aug 2024
LLaVA-OneVision: Easy Visual Task Transfer Bo Li Yuanhan Zhang Dong Guo Renrui Zhang Feng Li Hao Zhang Kaichen Zhang Yanwei Li Ziwei Liu Chunyuan Li MLLM SyDa VLM 58 569 0 06 Aug 2024
FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention Yu Lu Yuanzhi Liang Linchao Zhu Yi Yang DiffM VGen 44 27 0 29 Jul 2024
DreamStory: Open-Domain Story Visualization by LLM-Guided Multi-Subject Consistent Diffusion Huiguo He Huan Yang Zixi Tuo Yuan Zhou Qiuyue Wang Yuhang Zhang Zeyu Liu Wenhao Huang Hongyang Chao Jian Yin DiffM VGen 62 12 0 17 Jul 2024
SEED-Story: Multimodal Long Story Generation with Large Language Model Shuai Yang Yuying Ge Yang Li Yukang Chen Yixiao Ge Ying Shan Yingcong Chen VGen DiffM 83 26 0 11 Jul 2024
StoryDiffusion: How to Support UX Storyboarding With Generative-AI Zhaohui Liang Xiaoyu Zhang Kevin Ma Zhao Liu Xipei Ren K. Goucher-Lambert Can Liu DiffM 40 6 0 10 Jul 2024
Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models Fei Shen Hu Ye Sibo Liu Jun Zhang Cong Wang Xiao Han Wei Yang 92 34 0 02 Jul 2024
RetAssist: Facilitating Vocabulary Learners with Generative Images in Story Retelling Practices Qiaoyi Chen Siyu Liu Kaihui Huang Xingbo Wang Xiaojuan Ma Junkai Zhu Zhenhui Peng 35 3 0 23 May 2024
Evolving Storytelling: Benchmarks and Methods for New Character Customization with Diffusion Models Xiyu Wang Yufei Wang Satoshi Tsutsui Weisi Lin Bihan Wen Alex C. Kot 47 4 0 20 May 2024
Generating Coherent Sequences of Visual Illustrations for Real-World Manual Tasks João Bordalo Vasco Ramos Rodrigo Valerio Diogo Glória-Silva Yonatan Bitton Michal Yarom Idan Szpektor João Magalhães 36 7 0 16 May 2024
The Lost Melody: Empirical Observations on Text-to-Video Generation From A Storytelling Perspective Andrew Shin Yusuke Mori Kunitake Kaneko VGen EGVM 24 2 0 13 May 2024
TALC: Time-Aligned Captions for Multi-Scene Text-to-Video Generation Hritik Bansal Yonatan Bitton Michal Yarom Idan Szpektor Aditya Grover Kai-Wei Chang DiffM 57 11 0 07 May 2024
Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond Zheng Zhu Xiaofeng Wang Wangbo Zhao Chen Min Nianchen Deng ... Dawei Zhao Liang Xiao Jian-jun Zhao Jiwen Lu Guan Huang VGen LM&Ro 87 38 0 06 May 2024
TheaterGen: Character Management with LLM for Consistent Multi-turn Image Generation Junhao Cheng Baiqiao Yin Kaixin Cai Minbin Huang Hanhui Li ... Yue Li Yifei Li Yuhao Cheng Yiqiang Yan Xiaodan Liang DiffM MLLM 40 12 0 29 Apr 2024
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model Han Lin Jaemin Cho Abhaysinh Zala Mohit Bansal DiffM VGen 69 20 0 15 Apr 2024
StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion Ming Tao Bing-Kun Bao Hao Tang Yaowei Wang Changsheng Xu DiffM 46 5 0 09 Apr 2024
Many-to-many Image Generation with Auto-regressive Diffusion Models Ying Shen Yizhe Zhang Shuangfei Zhai Lifu Huang J. Susskind Jiatao Gu 40 6 0 03 Apr 2024
Masked Generative Story Transformer with Character Guidance and Caption Augmentation Christos Papadimitriou Giorgos Filandrianos Maria Lymperaiou Giorgos Stamou DiffM 102 1 0 13 Mar 2024
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production Jiuniu Wang Zehua Du Yuyuan Zhao Bo Yuan Kexiang Wang ... Yihen Lu Gengliang Li Junlong Gao Xin Tu Zhenyu Guo LLMAG VGen 36 7 0 12 Mar 2024
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation Joseph Cho Fachrina Dewi Puspitasari Sheng Zheng Jingyao Zheng Lik-Hang Lee Tae-Ho Kim Choong Seon Hong Chaoning Zhang EGVM VGen 38 40 0 08 Mar 2024
Examining Pathological Bias in a Generative Adversarial Network Discriminator: A Case Study on a StyleGAN3 Model Alvin Grissom II Ryan F. Lei Matt Gusdorff Jeova Farias Sales Rocha Neto Bailey Lin Ryan Trotter GAN 27 0 0 15 Feb 2024
STREAM: Spatio-TempoRal Evaluation and Analysis Metric for Video Generative Models Pum Jun Kim Seojun Kim Jaejun Yoo EGVM 30 3 0 30 Jan 2024
MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer Changyao Tian Xizhou Zhu Yuwen Xiong Weiyun Wang Zhe Chen ... Tong Lu Jie Zhou Hongsheng Li Yu Qiao Jifeng Dai AuLLM 85 42 0 18 Jan 2024
MagicScroll: Nontypical Aspect-Ratio Image Generation for Visual Storytelling via Multi-Layered Semantic-Aware Denoising Bingyuan Wang Hengyu Meng Zeyu Cai Lanjiong Li Yue Ma Qifeng Chen Zeyu Wang DiffM 37 3 0 18 Dec 2023
CogCartoon: Towards Practical Story Visualization Zhongyang Zhu Jie Tang DiffM 27 3 0 17 Dec 2023
DiffuVST: Narrating Fictional Scenes with Global-History-Guided Denoising Models Shengguang Wu Mei Yuan Qi Su DiffM 17 0 0 12 Dec 2023
Make-A-Storyboard: A General Framework for Storyboard with Disentangled and Merged Control Sitong Su Litao Guo Lianli Gao Hengtao Shen Jingkuan Song DiffM 35 3 0 06 Dec 2023
StoryGPT-V: Large Language Models as Consistent Story Visualizers Xiaoqian Shen Mohamed Elhoseiny VLM 101 10 0 04 Dec 2023
FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax Yu Lu Linchao Zhu Hehe Fan Yi Yang VGen DiffM 33 13 0 27 Nov 2023
AutoStory: Generating Diverse Storytelling Images with Minimal Human Effort Wen Wang Canyu Zhao Hao Chen Zhekai Chen Kecheng Zheng Chunhua Shen DiffM 27 22 0 19 Nov 2023