DriveLM: Driving with Graph Visual Question Answering

17 January 2025

Papers citing "DriveLM: Driving with Graph Visual Question Answering"

50 / 138 papers shown

Title
Senna: Bridging Large Vision-Language Models and End-to-End Autonomous Driving Bo Jiang Shaoyu Chen Bencheng Liao Xingyu Zhang Wei Yin Qian Zhang Chang Huang Wei Liu Xinyu Wang VLM MLLM LRM 41 13 0 29 Oct 2024
Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance Zhangwei Gao Zhe Chen Erfei Cui Yiming Ren Weiyun Wang ... Lewei Lu Tong Lu Yu Qiao Jifeng Dai Wenhai Wang VLM 67 24 0 21 Oct 2024
Robust RL with LLM-Driven Data Synthesis and Policy Adaptation for Autonomous Driving Sihao Wu Jiaxu Liu Xiangyu Yin Guangliang Cheng Xingyu Zhao Meng Fang Xinping Yi Xiaowei Huang 30 0 0 16 Oct 2024
HE-Drive: Human-Like End-to-End Driving with Vision Language Models Junming Wang Xingyu Zhang Zebin Xing Songen Gu Xiaoyang Guo Yang Hu Ziying Song Qian Zhang Xiaoxiao Long Wei Yin 46 9 0 07 Oct 2024
Driving with Regulation: Interpretable Decision-Making for Autonomous Vehicles with Retrieval-Augmented Reasoning via LLM Tianhui Cai Yifan Liu Zewei Zhou Haoxuan Ma Seth Z. Zhao Zhiwen Wu Jiaqi Ma 42 7 0 07 Oct 2024
Fira: Can We Achieve Full-rank Training of LLMs Under Low-rank Constraint? Xi Chen Kaituo Feng Changsheng Li Xunhao Lai Xiangyu Yue Ye Yuan Guoren Wang 39 7 0 02 Oct 2024
DualAD: Dual-Layer Planning for Reasoning in Autonomous Driving Dingrui Wang Marc Kaufeld Johannes Betz 38 0 0 26 Sep 2024
Enhancing LLM-based Autonomous Driving Agents to Mitigate Perception Attacks Ruoyu Song Muslum Ozgur Ozmen Hyungsub Kim Antonio Bianchi Z. Berkay Celik AAML 30 5 0 22 Sep 2024
A Survey on Multimodal Benchmarks: In the Era of Large AI Models Lin Li Guikun Chen Hanrong Shi Jun Xiao Long Chen 42 9 0 21 Sep 2024
Hey Robot! Personalizing Robot Navigation through Model Predictive Control with a Large Language Model Diego Martínez Baselga O. de Groot Luzia Knoedler Javier Alonso-Mora L. Riazuelo Luis Montano LM&Ro 46 0 0 20 Sep 2024
Video Token Sparsification for Efficient Multimodal LLMs in Autonomous Driving Yunsheng Ma Amr Abdelraouf Rohit Gupta Ziran Wang Kyungtae Han 26 3 0 16 Sep 2024
Hint-AD: Holistically Aligned Interpretability in End-to-End Autonomous Driving Kairui Ding Boyuan Chen Yuchen Su Huan-ang Gao Bu Jin ... Wuqiang Zhang Xiaohui Li Paul Barsch Hongyang Li Hao Zhao 50 3 0 10 Sep 2024
Lexicon3D: Probing Visual Foundation Models for Complex 3D Scene Understanding Yunze Man Shuhong Zheng Zhipeng Bao M. Hebert Liang-Yan Gui Yu-xiong Wang 72 15 0 05 Sep 2024
Towards General Industrial Intelligence: A Survey on IIoT-Enhanced Continual Large Models Jiao Chen Jiayi He Fangfang Chen Zuohong Lv Jianhua Tang Weihua Li Zuozhu Liu Howard H. Yang Guangjie Han AI4CE 36 1 0 02 Sep 2024
ContextVLM: Zero-Shot and Few-Shot Context Understanding for Autonomous Driving using Vision Language Models Shounak Sural Naren R. Rajkumar 35 1 0 30 Aug 2024
How Could Generative AI Support Compliance with the EU AI Act? A Review for Safe Automated Driving Perception Mert Keser Youssef Shoeb Alois Knoll 49 2 0 30 Aug 2024
Making Large Language Models Better Planners with Reasoning-Decision Alignment Zhijian Huang Tao Tang Shaoxiang Chen Sihao Lin Zequn Jie Lin Ma Guangrun Wang Xiaodan Liang 56 9 0 25 Aug 2024
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? Yi-Fan Zhang Huanyu Zhang Haochen Tian Chaoyou Fu Shuangqing Zhang ... Qingsong Wen Zhang Zhang L. Wang Rong Jin Tieniu Tan OffRL 66 36 0 23 Aug 2024
Edge-Cloud Collaborative Motion Planning for Autonomous Driving with Large Language Models Jiao Chen Suyan Dai Fangfang Chen Zuohong Lv Jianhua Tang 42 6 0 19 Aug 2024
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving Hidehisa Arai Keita Miwa Kento Sasaki Yu Yamaguchi Kohei Watanabe Shunsuke Aoki Issei Yamamoto 51 9 0 19 Aug 2024
AgentsCoMerge: Large Language Model Empowered Collaborative Decision Making for Ramp Merging Senkang Hu Zhengru Fang Zihan Fang Yiqin Deng Xianhao Chen Yuguang Fang Sam Kwong 46 14 0 07 Aug 2024
DriveArena: A Closed-loop Generative Simulation Platform for Autonomous Driving Xuemeng Yang Licheng Wen Yukai Ma Jianbiao Mei Xin Li ... Min Dou Botian Shi Liang He Yong-Jin Liu Yu Qiao VGen 33 16 0 01 Aug 2024
SimpleLLM4AD: An End-to-End Vision-Language Model with Graph Visual Question Answering for Autonomous Driving Peiru Zheng Yun Zhao Zhan Gong Hong Zhu Shaohua Wu MLLM 35 7 0 31 Jul 2024
Large Language Models for Human-like Autonomous Driving: A Survey Yun Li Kai Katsumata Ehsan Javanmardi Manabu Tsukada LM&MA 52 6 0 27 Jul 2024
WTS: A Pedestrian-Centric Traffic Video Dataset for Fine-grained Spatial-Temporal Understanding Quan Kong Yuki Kawana Rajat Saini Ashutosh Kumar Jingjing Pan ... Yohei Ozao Balázs Opra D. Anastasiu Yoichi Sato Norimasa Kobori VGen 38 8 0 22 Jul 2024
Exploring the Causality of End-to-End Autonomous Driving Jiankun Li Hao Li Jiangjiang Liu Zhikang Zou Xiaoqing Ye F. Wang Jizhou Huang Hua-Hong Wu Haifeng Wang LRM 61 4 0 09 Jul 2024
iLLM-TSC: Integration reinforcement learning and large language model for traffic signal control policy improvement Aoyu Pang Maonan Wang Man-On Pun Chung Shue Chen Xi Xiong 43 9 0 08 Jul 2024
Solving Motion Planning Tasks with a Scalable Generative Model Yihan Hu Siqi Chai Zhening Yang Jingyu Qian Kun Li Wenxin Shao Haichao Zhang Wei-ping Xu Qiang Liu 48 17 0 03 Jul 2024
Tokenize the World into Object-level Knowledge to Address Long-tail Events in Autonomous Driving Ran Tian Boyi Li Xinshuo Weng Yuxiao Chen Edward Schmerling Yue Wang Boris Ivanovic Marco Pavone 44 13 0 01 Jul 2024
NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking D. Dauner Marcel Hallgarten Tianyu Li Xinshuo Weng Zhiyu Huang ... Igor Gilitschenski Boris Ivanovic Marco Pavone Andreas Geiger Kashyap Chitta 65 35 0 21 Jun 2024
Asynchronous Large Language Model Enhanced Planner for Autonomous Driving Yuan-Hsin Chen Zi-han Ding Ziqin Wang Yan Wang Lijun Zhang Si Liu 71 12 0 20 Jun 2024
Using Multimodal Large Language Models for Automated Detection of Traffic Safety Critical Events M. Tami Huthaifa I. Ashqar Mohammed Elhenawy 42 3 0 19 Jun 2024
Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers Omer Sahin Tas Royden Wagner 56 1 0 17 Jun 2024
CarLLaVA: Vision language models for camera-only closed-loop driving Katrin Renz Long Chen Ana-Maria Marcu Jan Hünermann Benoît Hanotte Alice Karnsund Jamie Shotton Elahe Arani Oleg Sinavski VLM 46 18 0 14 Jun 2024
AD-H: Autonomous Driving with Hierarchical Agents Zaibin Zhang Shiyu Tang Yuanhang Zhang Talas Fu Yifan Wang Yang Liu Dong Wang Jing Shao Lijun Wang H. Lu 49 3 0 05 Jun 2024
DriVLMe: Enhancing LLM-based Autonomous Driving Agents with Embodied and Social Experiences Yidong Huang Jacob Sansom Ziqiao Ma Felix Gervits Joyce Chai 44 17 0 05 Jun 2024
Is a 3D-Tokenized LLM the Key to Reliable Autonomous Driving? Yifan Bai Dongming Wu Yingfei Liu Fan Jia Weixin Mao ... Yucheng Zhao Jianbing Shen Xing Wei Tiancai Wang Xiangyu Zhang MLLM 40 9 0 28 May 2024
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Shenyuan Gao Jiazhi Yang Li Chen Kashyap Chitta Yihang Qiu Andreas Geiger Jun Zhang Hongyang Li 65 75 0 27 May 2024
Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving Jianbiao Mei Yukai Ma Xuemeng Yang Licheng Wen Xinyu Cai ... Min Dou Botian Shi Liang He Yong-Jin Liu Yu Qiao 48 9 0 24 May 2024
Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension Runwei Guan Ruixiao Zhang Ningwei Ouyang Jianan Liu Ka Lok Man ... Ming Xu Jeremy S. Smith Eng Gee Lim Yutao Yue Hui Xiong 51 9 0 21 May 2024
VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications Mikhail Konenkov Artem Lykov Daria Trinitatova Dzmitry Tsetserukou 38 5 0 19 May 2024
Co-driver: VLM-based Autonomous Driving Assistant with Human-like Behavior and Understanding for Complex Road Scenes Ziang Guo Artem Lykov Zakhar Yagudin Mikhail Konenkov Dzmitry Tsetserukou VLM 35 5 0 09 May 2024
Language-Image Models with 3D Understanding Jang Hyun Cho Boris Ivanovic Yulong Cao Edward Schmerling Yue Wang ... Boyi Li Yurong You Philipp Krahenbuhl Yan Wang Marco Pavone LRM 42 16 0 06 May 2024
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning Shihao Wang Zhiding Yu Xiaohui Jiang Shiyi Lan Min Shi Nadine Chang Jan Kautz Ying Li Jose M. Alvarez LRM 40 47 0 02 May 2024
Physical Backdoor Attack can Jeopardize Driving with Vision-Large-Language Models Zhenyang Ni Rui Ye Yuxian Wei Zhen Xiang Yanfeng Wang Siheng Chen AAML 36 9 0 19 Apr 2024
Automated Evaluation of Large Vision-Language Models on Self-driving Corner Cases Kai Chen Yanze Li Wenhua Zhang Yanxin Liu Pengxiang Li ... Xinhai Zhao Zhenguo Li Dit-Yan Yeung Huchuan Lu Xu Jia ELM MLLM 57 28 0 16 Apr 2024
Enhancing Autonomous Vehicle Training with Language Model Integration and Critical Scenario Generation Hanlin Tian Kethan Reddy Yuxiang Feng Mohammed Quddus Y. Demiris Panagiotis Angeloudis 46 10 0 12 Apr 2024
Can Vehicle Motion Planning Generalize to Realistic Long-tail Scenarios? Marcel Hallgarten Julian Zapata Martin Stoll Katrin Renz Andreas Zell 43 10 0 11 Apr 2024
Scaling Multi-Camera 3D Object Detection through Weak-to-Strong Eliciting Hao Lu Jiaqi Tang Xinli Xu Xu Cao Yunpeng Zhang Guoqing Wang Dalong Du Hao Chen Ying Chen 35 3 0 10 Apr 2024
LeGo-Drive: Language-enhanced Goal-oriented Closed-Loop End-to-End Autonomous Driving Pranjal Paul Anant Garg Tushar Choudhary Arun Kumar Singh K. M. Krishna 49 3 0 29 Mar 2024