v1v2v3 (latest)

SpaceVLLM: Endowing Multimodal Large Language Model with Spatio-Temporal Video Grounding Capability

18 March 2025

Papers citing "SpaceVLLM: Endowing Multimodal Large Language Model with Spatio-Temporal Video Grounding Capability"

25 / 25 papers shown

Title
An End-to-End Real-World Camera Imaging Pipeline Kepeng Xu Zijia Ma Li Xu Gang He Yunsong Li Wenxin Yu Taichu Han Cheng Yang 132 6 0 16 Nov 2024
Towards Realistic Data Generation for Real-World Super-Resolution Long Peng Wenbo Li Renjing Pei Jingjing Ren Xueyang Fu Yang Wang Yang Cao Zheng-Jun Zha 63 18 0 11 Jun 2024
MSP-Former: Multi-Scale Projection Transformer for Single Image Desnowing Sixiang Chen Tian-Chun Ye Yun-Peng Liu Taodong Liao Y. Ye Erkang Chen Peng Chen ViT 72 53 0 12 Jul 2022
Restormer: Efficient Transformer for High-Resolution Image Restoration Syed Waqas Zamir Aditya Arora Salman Khan Munawar Hayat Fahad Shahbaz Khan Ming-Hsuan Yang ViT 173 2,232 0 18 Nov 2021
Single Image Defocus Deblurring Using Kernel-Sharing Parallel Atrous Convolutions Hyeongseok Son Junyong Lee Sunghyun Cho Seungyong Lee SupR 62 92 0 20 Aug 2021
Spatially-Adaptive Image Restoration using Distortion-Guided Networks Kuldeep Purohit Maitreya Suin A. N. Rajagopalan Vishnu Boddeti 57 117 0 19 Aug 2021
Uformer: A General U-Shaped Transformer for Image Restoration Zhendong Wang Xiaodong Cun Jianmin Bao Wengang Zhou Jianzhuang Liu Houqiang Li ViT 111 1,409 0 06 Jun 2021
Multi-Stage Progressive Image Restoration Syed Waqas Zamir Aditya Arora Salman Khan Munawar Hayat Fahad Shahbaz Khan Ming-Hsuan Yang Ling Shao 169 1,486 0 04 Feb 2021
Retinex-inspired Unrolling with Cooperative Prior Architecture Search for Low-light Image Enhancement Risheng Liu Long Ma Jiaao Zhang Xin-Yue Fan Zhongxuan Luo 91 584 0 10 Dec 2020
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai ... Matthias Minderer G. Heigold Sylvain Gelly Jakob Uszkoreit N. Houlsby ViT 657 41,103 0 22 Oct 2020
DCSFN: Deep Cross-scale Fusion Network for Single Image Rain Removal Cong Wang Xiaoying Xing Zhixun Su Junyang Chen 44 116 0 03 Aug 2020
Multi-Scale Progressive Fusion Network for Single Image Deraining Kui Jiang Zhongyuan Wang Peng Yi Chong Chen Baojin Huang Yimin Luo Jiayi Ma Junjun Jiang 76 593 0 24 Mar 2020
Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement Chunle Guo Chongyi Li Jichang Guo Chen Change Loy Junhui Hou Sam Kwong Runmin Cong DiffM 3DV 95 1,358 0 19 Jan 2020
Attention Guided Low-light Image Enhancement with a Large Scale Low-light Simulation Dataset Feifan Lv Yu Li Feng Lu 3DV 69 273 0 02 Aug 2019
Deep Retinex Decomposition for Low-Light Enhancement Chen Wei Wenjing Wang Wenhan Yang Jiaying Liu 102 1,725 0 14 Aug 2018
Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining Xia Li Jianlong Wu Zhouchen Lin Hong Liu H. Zha 75 734 0 16 Jul 2018
Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform Xintao Wang K. Yu Chao Dong Chen Change Loy SupR 75 983 0 09 Apr 2018
Density-aware Single Image De-raining using a Multi-stream Dense Network He Zhang Vishal M. Patel 110 854 0 21 Feb 2018
DesnowNet: Context-Aware Deep Network for Snow Removal Yun-Fu Liu Da-Wei Jaw Shih-Chia Huang Lei Li 65 331 0 15 Aug 2017
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring Seungjun Nah Tae Hyun Kim Kyoung Mu Lee 143 1,974 0 07 Dec 2016
Deep Joint Rain Detection and Removal from a Single Image Wenhan Yang R. Tan Jiashi Feng Jiaying Liu Zongming Guo Shuicheng Yan 195 1,005 0 25 Sep 2016
Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network Wenzhe Shi Jose Caballero Ferenc Huszár J. Totz Andrew P. Aitken Rob Bishop Daniel Rueckert Zehan Wang SupR 322 5,234 0 16 Sep 2016
SGDR: Stochastic Gradient Descent with Warm Restarts I. Loshchilov Frank Hutter ODL 333 8,130 0 13 Aug 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 2.2K 194,020 0 10 Dec 2015
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 1.8K 77,196 0 18 May 2015