v1v2 (latest)

DriveEditor: A Unified 3D Information-Guided Framework for Controllable Object Editing in Driving Scenes

31 December 2024

Papers citing "DriveEditor: A Unified 3D Information-Guided Framework for Controllable Object Editing in Driving Scenes"

25 / 25 papers shown

Title
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation Enhui Ma Lijun Zhou Tao Tang Zhan Zhang Dong Han ... Peng Jia Xianpeng Lang Haiyang Sun Di Lin Kaicheng Yu VGen 114 28 0 03 Jun 2024
SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control Binyuan Huang Yuqing Wen Yucheng Zhao Yaosi Hu Yingfei Liu ... Tiancai Wang Chi Zhang Chang Wen Chen Zhenzhong Chen Xiangyu Zhang 83 16 0 28 Mar 2024
Editable Scene Simulation for Autonomous Driving via Collaborative LLM-Agents Yuxi Wei Zi Wang Yifan Lu Chenxin Xu Chang-rui Liu Hao Zhao Siheng Chen Yanfeng Wang VGen 131 75 0 08 Feb 2024
Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions David Junhao Zhang Dongxu Li Hung Le Mike Zheng Shou Caiming Xiong Doyen Sahoo VGen 81 25 0 03 Jan 2024
RealCraft: Attention Control as A Tool for Zero-Shot Consistent Video Editing Shutong Jin Ruiyu Wang Florian T. Pokorny DiffM VGen 214 1 0 19 Dec 2023
DrivingDiffusion: Layout-Guided multi-view driving scene video generation with latent diffusion model Xiaofan Li Yifu Zhang Xiaoqing Ye VGen 125 78 0 11 Oct 2023
MagicDrive: Street View Generation with Diverse 3D Geometry Control Ruiyuan Gao Kai Chen Enze Xie Lanqing Hong Zhenguo Li Dit-Yan Yeung Qiang Xu DiffM 98 122 0 04 Oct 2023
DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving Xiaofeng Wang Zheng Hua Zhu Guan Huang Xinze Chen Jiagang Zhu Jiwen Lu VGen 116 168 0 18 Sep 2023
ProPainter: Improving Propagation and Transformer for Video Inpainting Shangchen Zhou Chongyi Li Kelvin C. K. Chan Chen Change Loy ViT 122 105 0 07 Sep 2023
EVE: Efficient zero-shot text-based Video Editing with Depth Map Guidance and Temporal Consistency Constraints Yutao Chen Xingning Dong Tian Gan Chunluan Zhou Ming-Hsuan Yang Qingpei Guo DiffM 74 5 0 21 Aug 2023
UniSim: A Neural Closed-Loop Sensor Simulator Ze Yang Yun Chen Jingkang Wang S. Manivasagam Wei-Chiu Ma A. Yang R. Urtasun 114 202 0 03 Aug 2023
BEVControl: Accurately Controlling Street-view Elements with Multi-perspective Consistency via BEV Sketch Layout Kairui Yang Enhui Ma Jibing Peng Qing Guo Di Lin Kaicheng Yu DiffM 142 66 0 03 Aug 2023
InFusion: Inject and Attention Fusion for Multi Concept Zero-Shot Text-based Video Editing Anant Khandelwal DiffM VGen 86 15 0 22 Jul 2023
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing Paul Couairon Clément Rambour Jean-Emmanuel Haugeard Nicolas Thome DiffM VGen 76 30 0 14 Jun 2023
Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation Shuai Yang Yifan Zhou Ziwei Liu Chen Change Loy VGen DiffM 104 222 0 13 Jun 2023
FateZero: Fusing Attentions for Zero-shot Text-based Video Editing Chenyang Qi Xiaodong Cun Yong Zhang Chenyang Lei Xintao Wang Ying Shan Qifeng Chen VGen 125 356 0 16 Mar 2023
Edit-A-Video: Single Video Editing with Object-Aware Consistency Chaehun Shin Heeseung Kim Che Hyun Lee Sang-gil Lee Sung-Hoon Yoon DiffM VGen 196 57 0 14 Mar 2023
Paint by Example: Exemplar-based Image Editing with Diffusion Models Binxin Yang Shuyang Gu Bo Zhang Ting Zhang Xuejin Chen Xiaoyan Sun Dong Chen Fang Wen DiffM 109 427 0 23 Nov 2022
Elucidating the Design Space of Diffusion-Based Generative Models Tero Karras M. Aittala Timo Aila S. Laine DiffM 297 2,038 0 01 Jun 2022
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation Zhijian Liu Haotian Tang Alexander Amini Xinyu Yang Huizi Mao Daniela Rus Song Han 232 924 0 26 May 2022
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 1.1K 30,111 0 26 Feb 2021
Scalability in Perception for Autonomous Driving: Waymo Open Dataset Pei Sun Henrik Kretzschmar Xerxes Dotiwalla Aurelien Chouard Vijaysai Patnaik ... Shuyang Cheng Yu Zhang Jonathon Shlens Zhifeng Chen Dragomir Anguelov 182 2,919 0 10 Dec 2019
Towards Accurate Generative Models of Video: A New Metric & Challenges Thomas Unterthiner Sjoerd van Steenkiste Karol Kurach Raphaël Marinier Marcin Michalski Sylvain Gelly EGVM VGen 101 748 0 03 Dec 2018
The Unreasonable Effectiveness of Deep Features as a Perceptual Metric Richard Y. Zhang Phillip Isola Alexei A. Efros Eli Shechtman Oliver Wang EGVM 428 11,994 0 11 Jan 2018
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 2.1K 77,870 0 18 May 2015