PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

2 June 2022

Papers citing "PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images"

50 / 265 papers shown

Title
Extending Large Vision-Language Model for Diverse Interactive Tasks in Autonomous Driving Zongchuang Zhao Haoyu Fu Dingkang Liang Xin Zhou Dingyuan Zhang Hongwei Xie Bing Wang Xiang Bai MLLM VLM 49 0 0 13 May 2025
SparseMeXT Unlocking the Potential of Sparse Representations for HD Map Construction Anqing Jiang Jinhao Chai Yu Gao Yishuo Wang Yuwen Heng ... Li Sun Jian Zhou Lijuan Zhu Shugong Xu Hao Zhao 26 0 0 12 May 2025
STCOcc: Sparse Spatial-Temporal Cascade Renovation for 3D Occupancy and Scene Flow Prediction Zhimin Liao Ping Wei Shuaijia Chen Haoxuan Wang Ziyang Ren 103 0 0 28 Apr 2025
Towards Latency-Aware 3D Streaming Perception for Autonomous Driving Jiaqi Peng Tai Wang Jiangmiao Pang Yuan Shen 47 0 0 27 Apr 2025
Revisiting Radar Camera Alignment by Contrastive Learning for 3D Object Detection Linhua Kong Dongxia Chang Lian Liu Zisen Kong Pengyuan Li Yao Zhao 28 0 0 23 Apr 2025
RoPETR: Improving Temporal Camera-Only 3D Detection by Integrating Enhanced Rotary Position Embedding Hang Ji Tao Ni Xufeng Huang Tao Luo Xin Zhan Junbo Chen 3DPC 47 0 0 17 Apr 2025
Rethinking Temporal Fusion with a Unified Gradient Descent View for 3D Semantic Occupancy Prediction Dubing Chen Huan Zheng Jin Fang Xingping Dong Xianfei Li Wenlong Liao Tao He Pai Peng Jianbing Shen 42 0 0 17 Apr 2025
MDP: Multidimensional Vision Model Pruning with Latency Constraint Xinglong Sun Barath Lakshmanan Maying Shen Shiyi Lan Jingde Chen Jose M. Alvarez VLM 49 0 0 02 Apr 2025
Toward Real-world BEV Perception: Depth Uncertainty Estimation via Gaussian Splatting Shu-Wei Lu Yi-Hsuan Tsai Yi-Ting Chen 35 0 0 02 Apr 2025
Omnidirectional Depth-Aided Occupancy Prediction based on Cylindrical Voxel for Autonomous Driving Chaofan Wu Jiashi Li Jinghao Cao Ming Li Yongkang Feng J. Xu Zihang Gao S. Du Yang Li MDE 25 0 0 26 Mar 2025
3D Occupancy Prediction with Low-Resolution Queries via Prototype-aware View Transformation Gyeongrok Oh Sungjune Kim Heeju Ko Hyung-Gun Chi J. Kim Dongwook Lee Daehyun Ji Sungjoon Choi Sujin Jang Sangpil Kim 41 0 0 19 Mar 2025
MamBEV: Enabling State Space Models to Learn Birds-Eye-View Representations Hongyu Ke Jack Morris K. Oguchi Xiaofei Cao Yongkang Liu Haoxin Wang Yi Ding Mamba 73 0 0 18 Mar 2025
RoCo-Sim: Enhancing Roadside Collaborative Perception through Foreground Simulation Yuwen Du Anning Hu Zichen Chao Yifan Lu Junhao Ge Genjia Liu Weitao Wu Lanjun Wang Siheng Chen 83 0 0 13 Mar 2025
Accelerate 3D Object Detection Models via Zero-Shot Attention Key Pruning Lizhen Xu Xiuxiu Bai Xiaojun Jia Jianwu Fang Shanmin Pang 63 0 0 13 Mar 2025
HisTrackMap: Global Vectorized High-Definition Map Construction via History Map Tracking Jing Yang Sen Yang Xiao Tan Hanli Wang 53 1 0 13 Mar 2025
DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving Xiaosong Jia Junqi You Zhiyuan Zhang Junchi Yan 46 5 0 07 Mar 2025
Glad: A Streaming Scene Generator for Autonomous Driving Bin Xie Yingfei Liu Tiancai Wang Jiale Cao Xinming Zhang 3DGS VGen 54 1 0 26 Feb 2025
LXLv2: Enhanced LiDAR Excluded Lean 3D Object Detection with Fusion of 4D Radar and Camera Weiyi Xiong Zean Zou Qiuchi Zhao Fengchun He Bing Zhu 72 1 0 21 Feb 2025
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset Goodarz Mehr A. Eskandarian 68 1 0 04 Feb 2025
SoundLoc3D: Invisible 3D Sound Source Localization and Classification Using a Multimodal RGB-D Acoustic Camera Yuhang He Sangyun Shin Anoop Cherian Niki Trigoni Andrew Markham 78 0 0 31 Dec 2024
TopView: Vectorising road users in a bird's eye view from uncalibrated street-level imagery with deep learning Mohamed R Ibrahim 70 1 0 18 Dec 2024
RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion Xiaomeng Chu Jiajun Deng Guoliang You YiFan Duan Houqiang Li Yanyong Zhang 176 0 0 17 Dec 2024
HSDA: High-frequency Shuffle Data Augmentation for Bird's-Eye-View Map Segmentation Calvin Glisson Qiuxiao Chen 77 0 0 09 Dec 2024
Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention Hannan Lu Xiaohe Wu Shudong Wang Xiameng Qin Xinyu Zhang Junyu Han W. Zuo Ji Tao 92 1 0 04 Dec 2024
Redundant Queries in DETR-Based 3D Detection Methods: Unnecessary and Prunable Lizhen Xu Shanmin Pang Wenzhao Qiu Zehao Wu Xiuxiu Bai K. Mei Jianru Xue 80 1 0 03 Dec 2024
Epipolar Attention Field Transformers for Bird's Eye View Semantic Segmentation Christian Witte Jens Behley Cyrill Stachniss Marvin Raaijmakers 91 0 0 02 Dec 2024
SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection Philipp Wolters Johannes Gilg Torben Teepe Fabian Herzog Felix Fent Gerhard Rigoll 83 0 0 29 Nov 2024
Monocular Lane Detection Based on Deep Learning: A Survey Xin He Haiyun Guo Kuan Zhu Bingke Zhu Xu Zhao Jianwu Fang J. T. Wang 95 1 0 25 Nov 2024
Three Cars Approaching within 100m! Enhancing Distant Geometry by Tri-Axis Voxel Scanning for Camera-based Semantic Scene Completion Jongseong Bae Junwoo Ha Ha Young Kim 84 0 0 25 Nov 2024
A Resource Efficient Fusion Network for Object Detection in Bird's-Eye View using Camera and Raw Radar Data Kavin Chandrasekaran Sorin Grigorescu Gijs Dubbelman P. Jancura 86 0 0 20 Nov 2024
EVT: Efficient View Transformation for Multi-Modal 3D Object Detection Yongjin Lee Hyeon-Mun Jeong Yurim Jeon Sanghyun Kim 45 0 0 16 Nov 2024
OccLoff: Learning Optimized Feature Fusion for 3D Occupancy Prediction Ji Zhang Yiran Ding Zixin Liu 3DPC 43 3 0 06 Nov 2024
HeightMapNet: Explicit Height Modeling for End-to-End HD Map Learning Wenzhao Qiu Shanmin Pang Hao zhang Jianwu Fang Jianru Xue 33 0 0 03 Nov 2024
GAFusion: Adaptive Fusing LiDAR and Camera with Multiple Guidance for 3D Object Detection Xiaotian Li Baojie Fan Jiandong Tian Huijie Fan 3DPC 53 9 0 01 Nov 2024
BEVPose: Unveiling Scene Semantics through Pose-Guided Multi-Modal BEV Alignment M. Hosseinzadeh Ian Reid 33 1 0 28 Oct 2024
UniDrive: Towards Universal Driving Perception Across Camera Configurations Ye Li Wenzhao Zheng Xiaonan Huang Kurt Keutzer 43 1 0 17 Oct 2024
Cocoon: Robust Multi-Modal Perception with Uncertainty-Aware Sensor Fusion Minkyoung Cho Yulong Cao Jiachen Sun Qingzhao Zhang Marco Pavone Jeong Joon Park Heng Yang Z. Morley Mao 34 0 0 16 Oct 2024
Real-time Stereo-based 3D Object Detection for Streaming Perception Changcai Li Zonghua Gu Gang Chen Libo Huang Wei Zhang Huihui Zhou 3DPC 27 0 0 16 Oct 2024
TEOcc: Radar-camera Multi-modal Occupancy Prediction via Temporal Enhancement Zhiwei Lin Hongbo Jin Yongtao Wang Yufei Wei Nan Dong 41 2 0 15 Oct 2024
UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles Hui Ye Rajshekhar Sunderraman Shihao Ji 26 2 0 14 Oct 2024
ROA-BEV: 2D Region-Oriented Attention for BEV-based 3D Object Jiwei Chen Laiyan Ding Chi Zhang Feifei Li Rui Huang 28 0 0 14 Oct 2024
QuadBEV: An Efficient Quadruple-Task Perception Framework via Bird's-Eye-View Representation Yuxin Li Yiheng Li Xulei Yang Mengying Yu Zihang Huang Xiaojun Wu Chai Kiat Yeo 36 0 0 09 Oct 2024
Cross-Camera Data Association via GNN for Supervised Graph Clustering Đorđe Nedeljković 26 0 0 01 Oct 2024
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness Chenming Zhu Tai Wang Wenwei Zhang Jiangmiao Pang Xihui Liu 134 32 0 26 Sep 2024
RopeBEV: A Multi-Camera Roadside Perception Network in Bird's-Eye-View Jinrang Jia Guangqi Yi Yifeng Shi 34 0 0 18 Sep 2024
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving Haisheng Su Wei Wu Junchi Yan 39 0 0 15 Sep 2024
OPUS: Occupancy Prediction Using a Sparse Set Jiabao Wang Zhaojiang Liu Qiang Meng Liujiang Yan Ke Wang Jie Yang Wei Liu Qibin Hou Ming-Ming Cheng 35 9 0 14 Sep 2024
RCBEVDet++: Toward High-accuracy Radar-Camera Fusion 3D Perception Network Zhiwei Lin Zhe Liu Yongtao Wang Le Zhang Ce Zhu 39 4 0 08 Sep 2024
GeoBEV: Learning Geometric BEV Representation for Multi-view 3D Object Detection Jinqing Zhang Yanan Zhang Yunlong Qi Z. Fu Qingjie Liu Yunhong Wang 28 3 0 03 Sep 2024
Make Your ViT-based Multi-view 3D Detectors Faster via Token Compression Dingyuan Zhang Dingkang Liang Zichang Tan Xiaoqing Ye Cheng Zhang Jingdong Wang Xiang Bai ViT 51 2 0 01 Sep 2024