Multi-Frame, Lightweight & Efficient Vision-Language Models for Question
Answering in Autonomous Driving

v1v2 (latest)

Multi-Frame, Lightweight & Efficient Vision-Language Models for Question Answering in Autonomous Driving

28 March 2024

Akshay Gopalkrishnan

Mohan M. Trivedi

ArXiv (abs)PDF HTML Github (76★)

Papers citing "Multi-Frame, Lightweight & Efficient Vision-Language Models for Question Answering in Autonomous Driving"

7 / 7 papers shown

Title
Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis Yuan Gao Mattia Piccinini Yuchen Zhang Dingrui Wang Korbinian Moller ... Steven Peters Andrea Stocco Bassam Alrifaee Marco Pavone Johannes Betz 23 0 0 13 Jun 2025
Urban Computing in the Era of Large Language Models Zhonghang Li Lianghao Xia Xubin Ren J. Tang Tianyi Chen Yong-mei Xu Chenyu Huang 218 0 0 02 Apr 2025
Vision-Language Models for Edge Networks: A Comprehensive Survey Ahmed Sharshar Latif U. Khan Waseem Ullah Mohsen Guizani VLM 160 3 0 11 Feb 2025
VLM-Assisted Continual learning for Visual Question Answering in Self-Driving Yuxin Lin Mengshi Qi Liang Liu Huadong Ma CLL 80 2 0 02 Feb 2025
DriveLM: Driving with Graph Visual Question Answering Chonghao Sima Katrin Renz Kashyap Chitta Lawrence Yunliang Chen Hanxue Zhang Chengen Xie Jens Beißwenger Ping Luo Andreas Geiger Hongyang Li 291 207 0 17 Jan 2025
LaVida Drive: Vision-Text Interaction VLM for Autonomous Driving with Token Selection, Recovery and Enhancement Siwen Jiao Yangyi Fang Baoyun Peng Wangqun Chen Bharadwaj Veeravalli 223 5 0 20 Nov 2024
LLM4Drive: A Survey of Large Language Models for Autonomous Driving Zhenjie Yang Xiaosong Jia Hongyang Li Junchi Yan ELM 142 121 0 02 Nov 2023