X-Drive: Cross-modality consistent multi-sensor data synthesis for driving scenarios

2 November 2024

ArXiv (abs)PDF HTML Github (51★)

Papers citing "X-Drive: Cross-modality consistent multi-sensor data synthesis for driving scenarios"

34 / 34 papers shown

Title
MObI: Multimodal Object Inpainting Using Diffusion Models Alexandru Buburuzan Anuj Sharma John Redford P. Dokania Romain Mueller DiffM 168 1 0 06 Jan 2025
DreamForge: Motion-Aware Autoregressive Video Generation for Multi-View Driving Scenes Jianbiao Mei T. Hu Xuemeng Yang Licheng Wen Yu Yang Tiantian Wei Yukai Ma Min Dou Botian Shi Yong Liu VGen DiffM 129 6 0 06 Sep 2024
Learning Temporally Consistent Video Depth from Video Diffusion Priors Jiahao Shao Yuanbo Yang Hongyu Zhou Youmin Zhang Yujun Shen Vitor Campagnolo Guizilini Yue Wang Matteo Poggi Yiyi Liao VGen DiffM MDE 94 43 0 03 Jun 2024
Cohere3D: Exploiting Temporal Coherence for Unsupervised Representation Learning of Vision-based Autonomous Driving Yichen Xie Hongge Chen Gregory P. Meyer Yong Jae Lee Eric M. Wolff Masayoshi Tomizuka Wei Zhan Yuning Chai Xin Huang 3DPC 65 1 0 23 Feb 2024
DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes Xiaoyu Zhou Zhiwei Lin Xiaojun Shan Yongtao Wang Deqing Sun Ming-Hsuan Yang 3DGS 112 201 0 13 Dec 2023
Sequential Modeling Enables Scalable Learning for Large Vision Models Yutong Bai Xinyang Geng K. Mangalam Amir Bar Alan Yuille Trevor Darrell Jitendra Malik Alexei A. Efros MLLM VLM 70 169 0 01 Dec 2023
UniPAD: A Universal Pre-training Paradigm for Autonomous Driving Honghui Yang Sha Zhang Di Huang Xiaoyang Wu Haoyi Zhu ... Hengshuang Zhao Qibo Qiu Binbin Lin Xiaofei He Wanli Ouyang SSL 87 51 0 12 Oct 2023
DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving Xiaofeng Wang Zheng Hua Zhu Guan Huang Xinze Chen Jiagang Zhu Jiwen Lu VGen 101 166 0 18 Sep 2023
BEVControl: Accurately Controlling Street-view Elements with Multi-perspective Consistency via BEV Sketch Layout Kairui Yang Enhui Ma Jibing Peng Qing Guo Di Lin Kaicheng Yu DiffM 84 66 0 03 Aug 2023
LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation Guangcong Zheng Xianpan Zhou Xuewei Li Zhongang Qi Ying Shan Xi Li DiffM 82 190 0 30 Mar 2023
Adding Conditional Control to Text-to-Image Diffusion Models Lvmin Zhang Anyi Rao Maneesh Agrawala AI4CE 180 4,168 1 10 Feb 2023
Scalable Diffusion Models with Transformers William S. Peebles Saining Xie GNN 118 2,418 0 19 Dec 2022
MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation Ludan Ruan Yi Ma Huan Yang Huiguo He Bei Liu Jianlong Fu Nicholas Jing Yuan Qin Jin B. Guo DiffM VGen 109 189 0 19 Dec 2022
InstructPix2Pix: Learning to Follow Image Editing Instructions Tim Brooks Aleksander Holynski Alexei A. Efros DiffM 209 1,830 0 17 Nov 2022
Make-A-Video: Text-to-Video Generation without Text-Video Data Uriel Singer Adam Polyak Thomas Hayes Xiaoyue Yin Jie An ... Oron Ashual Oran Gafni Devi Parikh Sonal Gupta Yaniv Taigman DiffM VGen 83 1,428 0 29 Sep 2022
Learning to Generate Realistic LiDAR Point Clouds Vlas Zyrianov Xiyue Zhu Shenlong Wang 3DPC DiffM 143 62 0 08 Sep 2022
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation Zhijian Liu Haotian Tang Alexander Amini Xinyu Yang Huizi Mao Daniela Rus Song Han 153 914 0 26 May 2022
PETR: Position Embedding Transformation for Multi-View 3D Object Detection Yingfei Liu Tiancai Wang Xinming Zhang Jian Sun 3DPC 121 549 0 10 Mar 2022
Generating Videos with Dynamics-aware Implicit Generative Adversarial Networks Sihyun Yu Jihoon Tack Sangwoo Mo Hyunsu Kim Junho Kim Jung-Woo Ha Jinwoo Shin DiffM VGen 104 201 0 21 Feb 2022
High-Resolution Image Synthesis with Latent Diffusion Models Robin Rombach A. Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer 3DV 485 15,734 0 20 Dec 2021
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models Alex Nichol Prafulla Dhariwal Aditya A. Ramesh Pranav Shyam Pamela Mishkin Bob McGrew Ilya Sutskever Mark Chen 364 3,627 0 20 Dec 2021
SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations Chenlin Meng Yutong He Yang Song Jiaming Song Jiajun Wu Jun-Yan Zhu Stefano Ermon DiffM 149 1,504 0 02 Aug 2021
Diffusion Models Beat GANs on Image Synthesis Prafulla Dhariwal Alex Nichol 268 7,938 0 11 May 2021
RangeDet:In Defense of Range View for LiDAR-based 3D Object Detection Lue Fan Xuan Xiong Feng Wang Nai-long Wang Zhaoxiang Zhang 3DPC 104 224 0 18 Mar 2021
Categorical Depth Distribution Network for Monocular 3D Object Detection Cody Reading Ali Harakeh Julia Chae Steven L. Waslander 3DPC 258 496 0 01 Mar 2021
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 967 29,810 0 26 Feb 2021
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai ... Matthias Minderer G. Heigold Sylvain Gelly Jakob Uszkoreit N. Houlsby ViT 670 41,430 0 22 Oct 2020
Sound2Sight: Generating Visual Dynamics from Sound and Context A. Cherian Moitreya Chatterjee Narendra Ahuja VGen 107 36 0 23 Jul 2020
Denoising Diffusion Probabilistic Models Jonathan Ho Ajay Jain Pieter Abbeel DiffM 691 18,310 0 19 Jun 2020
nuScenes: A multimodal dataset for autonomous driving Holger Caesar Varun Bankiti Alex H. Lang Sourabh Vora Venice Erin Liong Qiang Xu Anush Krishnan Yuxin Pan G. Baldan Oscar Beijbom 3DPC 301 5,779 0 26 Mar 2019
Deep Generative Modeling of LiDAR Data Lucas Caccia H. V. Hoof Aaron Courville Joelle Pineau 3DPC 191 76 0 04 Dec 2018
Deep Cross-Modal Audio-Visual Generation Lele Chen Sudhanshu Srivastava Z. Duan Chenliang Xu 95 221 0 26 Apr 2017
Image-to-Image Translation with Conditional Adversarial Networks Phillip Isola Jun-Yan Zhu Tinghui Zhou Alexei A. Efros SSeg 331 19,690 0 21 Nov 2016
Deep Unsupervised Learning using Nonequilibrium Thermodynamics Jascha Narain Sohl-Dickstein Eric A. Weiss Niru Maheswaranathan Surya Ganguli SyDa DiffM 306 7,016 0 12 Mar 2015