Language Adaptive Weight Generation for Multi-task Visual Grounding

6 June 2023

Xi Li

Papers citing "Language Adaptive Weight Generation for Multi-task Visual Grounding"

26 / 26 papers shown

Title
SwimVG: Step-wise Multimodal Fusion and Adaption for Visual Grounding Liangtao Shi Ting Liu Xiantao Hu Yue Hu Quanjun Yin Richang Hong ObjD 54 0 0 24 Feb 2025
Multi-task Visual Grounding with Coarse-to-Fine Consistency Constraints Ming Dai Jian Li Jiedong Zhuang Xian Zhang Wankou Yang ObjD 44 1 0 12 Jan 2025
MaPPER: Multimodal Prior-guided Parameter Efficient Tuning for Referring Expression Comprehension Ting Liu Zunnan Xu Yue Hu Liangtao Shi Zhiqiang Wang Quanjun Yin 67 2 0 03 Jan 2025
Towards Visual Grounding: A Survey Linhui Xiao Xiaoshan Yang X. Lan Yaowei Wang Changsheng Xu ObjD 67 4 0 31 Dec 2024
To Predict or Not To Predict? Proportionally Masked Autoencoders for Tabular Data Imputation Jungkyu Kim Kibok Lee Taeyoung Park 52 0 0 26 Dec 2024
Paint Outside the Box: Synthesizing and Selecting Training Data for Visual Grounding Zilin Du Haoxin Li Jianfei Yu Boyang Li 227 0 0 01 Dec 2024
OneRef: Unified One-tower Expression Grounding and Segmentation with Mask Referring Modeling Linhui Xiao Xiaoshan Yang Fang Peng Yaowei Wang Changsheng Xu ObjD 40 5 0 10 Oct 2024
Make Graph-based Referring Expression Comprehension Great Again through Expression-guided Dynamic Gating and Regression Jingcheng Ke Dele Wang Jun-Cheng Chen I-Hong Jhuo Chia-Wen Lin Yen-Yu Lin 35 0 0 05 Sep 2024
Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery Long Bai Guankun Wang Mobarakol Islam Lalithkumar Seenivasan An-Chi Wang Hongliang Ren 54 13 0 09 Aug 2024
An Efficient and Effective Transformer Decoder-Based Framework for Multi-Task Visual Grounding Wei Chen Mahdieh Hatamian Yu Wu 50 3 0 02 Aug 2024
CLASH: Complementary Learning with Neural Architecture Search for Gait Recognition Huanzhang Dou Pengyi Zhang Yuhan Zhao Lu Jin Xi Li CVBM 48 7 0 04 Jul 2024
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding Weitai Kang Gaowen Liu Mubarak Shah Yan Yan ObjD 41 9 0 03 Jul 2024
GVDIFF: Grounded Text-to-Video Generation with Diffusion Models Huanzhang Dou Ruixiang Li Wei Su Xi Li DiffM 44 1 0 02 Jul 2024
UniAV: Unified Audio-Visual Perception for Multi-Task Video Localization Tiantian Geng Teng Wang Yanfu Zhang Jinming Duan Weili Guan Feng Zheng 36 0 0 04 Apr 2024
Cycle-Consistency Learning for Captioning and Grounding Ning Wang Jiajun Deng Mingbo Jia ObjD 45 7 0 23 Dec 2023
InstructDET: Diversifying Referring Object Detection with Generalized Instructions Ronghao Dang Jiangyan Feng Haodong Zhang Chongjian Ge Lin Song ... Chengju Liu Qi Chen Feng Zhu Rui Zhao Yibing Song ObjD 32 11 0 08 Oct 2023
VGDiffZero: Text-to-image Diffusion Models Can Be Zero-shot Visual Grounders Xuyang Liu Siteng Huang Yachen Kang Honggang Chen Donglin Wang ObjD 38 12 0 03 Sep 2023
GaitMPL: Gait Recognition with Memory-Augmented Progressive Learning Huanzhang Dou Pengyi Zhang Yuhan Zhao Lin Dong Zequn Qin Xi Li CVBM VLM 41 24 0 06 Jun 2023
MetaGait: Learning to Learn an Omni Sample Adaptive Representation for Gait Recognition Huanzhang Dou Pengyi Zhang Wei Su Yunlong Yu Xi Li CVBM 31 31 0 06 Jun 2023
GaitGCI: Generative Counterfactual Intervention for Gait Recognition Huanzhang Dou Pengyi Zhang Wei Su Yunlong Yu Yining Lin Xi Li CVBM 36 35 0 06 Jun 2023
LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation Guangcong Zheng Xianpan Zhou Xuewei Li Zhongang Qi Ying Shan Xi Li DiffM 38 172 0 30 Mar 2023
Parallel Vertex Diffusion for Unified Visual Grounding Ze-Long Cheng Kehan Li Peng Jin Xiang Ji Li-ming Yuan Chang-rui Liu Jie Chen DiffM 39 25 0 13 Mar 2023
Omni-Dimensional Dynamic Convolution Chao Li Aojun Zhou Anbang Yao 46 228 0 16 Sep 2022
Self-paced Multi-grained Cross-modal Interaction Modeling for Referring Expression Comprehension Peihan Miao Wei Su Gaoang Wang Xuewei Li Xi Li ObjD 35 9 0 21 Apr 2022
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang Jiaqi Wang Yansong Tang Kai-xiang Chen Hengshuang Zhao Philip Torr 148 309 0 04 Dec 2021
Multi-task Collaborative Network for Joint Referring Expression Comprehension and Segmentation Gen Luo Yiyi Zhou Xiaoshuai Sun Liujuan Cao Chenglin Wu Cheng Deng Rongrong Ji ObjD 185 286 0 19 Mar 2020