Uncertainty-Guided Enhancement on Driving Perception System via
Foundation Models

Uncertainty-Guided Enhancement on Driving Perception System via Foundation Models

2 October 2024

Mao Ye

ArXiv (abs)PDF HTML

Papers citing "Uncertainty-Guided Enhancement on Driving Perception System via Foundation Models"

18 / 18 papers shown

Title
Hard Cases Detection in Motion Prediction by Vision-Language Foundation Models Yi Yang Qingwen Zhang Kei Ikemura Nazre Batool John Folkesson VLM 61 2 0 31 May 2024
Pre-trained Transformer-Enabled Strategies with Human-Guided Fine-Tuning for End-to-end Navigation of Autonomous Vehicles Dong Hu Chao Huang Jingda Wu Hongbo Gao 82 6 0 20 Feb 2024
GenAD: Generative End-to-End Autonomous Driving Wenzhao Zheng Ruiqi Song Xianda Guo Chenming Zhang Long Chen 125 69 0 18 Feb 2024
A Survey for Foundation Models in Autonomous Driving Haoxiang Gao Yaqian Li Kaiwen Long Ming Yang Yiqing Shen VLM LRM 98 31 0 02 Feb 2024
Open World Object Detection in the Era of Foundation Models O. Zohar Alejandro Lozano Shelly Goel Serena Yeung Kuan-Chieh Wang VLM 80 11 0 10 Dec 2023
GPT-4 Enhanced Multimodal Grounding for Autonomous Driving: Leveraging Cross-Modal Attention with Large Language Models Haicheng Liao Huanming Shen Zhenning Li Chengyue Wang Guofa Li Yiming Bie Chengzhong Xu 85 54 0 06 Dec 2023
On the Road with GPT-4V(ision): Early Explorations of Visual-Language Model on Autonomous Driving Licheng Wen Xuemeng Yang Daocheng Fu Xiaofeng Wang Pinlong Cai ... Xinyu Cai Min Dou Shuanglu Hu Botian Shi Yu Qiao VLM 88 85 0 09 Nov 2023
Fine-Tuning Language Models Using Formal Methods Feedback Yunhao Yang N. Bhatt Tyler Ingebrand William Ward Steven Carr Zhangyang Wang Ufuk Topcu 64 9 0 27 Oct 2023
Qwen Technical Report Jinze Bai Shuai Bai Yunfei Chu Zeyu Cui Kai Dang ... Zhenru Zhang Chang Zhou Jingren Zhou Xiaohuan Zhou Tianhang Zhu OSLM 268 1,908 0 28 Sep 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.5K 14,761 0 15 Mar 2023
ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature Learning Shengchao Hu Li Chen Peng Wu Hongyang Li Junchi Yan Dacheng Tao 95 253 0 15 Jul 2022
CoCa: Contrastive Captioners are Image-Text Foundation Models Jiahui Yu Zirui Wang Vijay Vasudevan Legg Yeung Mojtaba Seyedhosseini Yonghui Wu VLM CLIP OffRL 184 1,309 0 04 May 2022
Prompting Visual-Language Models for Efficient Video Understanding Chen Ju Tengda Han Kunhao Zheng Ya Zhang Weidi Xie VPVLM VLM 105 381 0 08 Dec 2021
Florence: A New Foundation Model for Computer Vision Lu Yuan Dongdong Chen Yi-Ling Chen Noel Codella Xiyang Dai ... Zhen Xiao Jianwei Yang Michael Zeng Luowei Zhou Pengchuan Zhang VLM 147 908 0 22 Nov 2021
VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding Hu Xu Gargi Ghosh Po-Yao (Bernie) Huang Prahal Arora Masoumeh Aminzadeh Christoph Feichtenhofer Florian Metze Luke Zettlemoyer 62 133 0 20 May 2021
Object Detection in 20 Years: A Survey Zhengxia Zou Keyan Chen Zhenwei Shi Yuhong Guo Jieping Ye VLM ObjD AI4TS 143 2,386 0 13 May 2019
nuScenes: A multimodal dataset for autonomous driving Holger Caesar Varun Bankiti Alex H. Lang Sourabh Vora Venice Erin Liong Qiang Xu Anush Krishnan Yuxin Pan G. Baldan Oscar Beijbom 3DPC 301 5,790 0 26 Mar 2019
A tutorial on conformal prediction Glenn Shafer V. Vovk 459 1,152 0 21 Jun 2007