UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation

4 February 2025

Papers citing "UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation"

47 / 47 papers shown

Title
Vision-Centric Representation-Efficient Fine-Tuning for Robust Universal Foreground Segmentation Guoyi Zhang Siyang Chen Guangsheng Xu Han Wang Xiaohu Zhang 49 0 0 20 Apr 2025
Rethinking Patch Dependence for Masked Autoencoders Letian Fu Long Lian Renhao Wang Baifeng Shi Xudong Wang Adam Yala Trevor Darrell Alexei A. Efros Ken Goldberg 54 14 0 25 Jan 2024
PAD: Self-Supervised Pre-Training with Patchwise-Scale Adapter for Infrared Images Tao Zhang Kun Ding Jinyong Wen Yu Xiong Zeyu Zhang Shiming Xiang Chunhong Pan 43 3 0 13 Dec 2023
EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything Yunyang Xiong Bala Varadarajan Lemeng Wu Xiaoyu Xiang Fanyi Xiao ... Dilin Wang Fei Sun Forrest N. Iandola Raghuraman Krishnamoorthi Vikas Chandra VLM 64 142 0 01 Dec 2023
What Do Self-Supervised Vision Transformers Learn? Namuk Park Wonjae Kim Byeongho Heo Taekyung Kim Sangdoo Yun SSL 126 76 1 01 May 2023
DINOv2: Learning Robust Visual Features without Supervision Maxime Oquab Timothée Darcet Théo Moutakanni Huy Q. Vo Marc Szafraniec ... Hervé Jégou Julien Mairal Patrick Labatut Armand Joulin Piotr Bojanowski VLM CLIP SSL 240 3,205 0 14 Apr 2023
TinyMIM: An Empirical Study of Distilling MIM Pre-trained Models Sucheng Ren Fangyun Wei Zheng Zhang Han Hu 76 37 0 03 Jan 2023
EVA: Exploring the Limits of Masked Visual Representation Learning at Scale Yuxin Fang Wen Wang Binhui Xie Quan-Sen Sun Ledell Yu Wu Xinggang Wang Tiejun Huang Xinlong Wang Yue Cao VLM CLIP 139 693 0 14 Nov 2022
Exploring Target Representations for Masked Autoencoders Xingbin Liu Jinghao Zhou Tao Kong Xianming Lin Rongrong Ji 115 50 0 08 Sep 2022
Masked Autoencoders Enable Efficient Knowledge Distillers Yutong Bai Zeyu Wang Junfei Xiao Chen Wei Huiyu Wang Alan Yuille Yuyin Zhou Cihang Xie CLL 47 40 0 25 Aug 2022
MILAN: Masked Image Pretraining on Language Assisted Representation Zejiang Hou Fei Sun Yen-kuang Chen Yuan Xie S. Kung ViT 46 68 0 11 Aug 2022
Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation Feng Li Hao Zhang Hu-Sheng Xu Siyi Liu Lei Zhang L. Ni H. Shum ISeg 85 373 0 06 Jun 2022
A Closer Look at Self-Supervised Lightweight Vision Transformers Shaoru Wang Jin Gao Zeming Li Jian Sun Weiming Hu ViT 80 42 0 28 May 2022
Vision Transformer Adapter for Dense Predictions Zhe Chen Yuchen Duan Wenhai Wang Junjun He Tong Lu Jifeng Dai Yu Qiao 50 552 0 17 May 2022
ROMA: Cross-Domain Region Similarity Matching for Unpaired Nighttime Infrared to Daytime Visible Video Translation Zhenjie Yu Kai Chen Shuang Li Bingfeng Han Chi Harold Liu Shuigen Wang 37 16 0 26 Apr 2022
DeiT III: Revenge of the ViT Hugo Touvron Matthieu Cord Hervé Jégou ViT 99 402 0 14 Apr 2022
Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline Pengyu Zhang Jie Zhao D. Wang Huchuan Lu Xiang Ruan 38 138 0 08 Apr 2022
Exploring Plain Vision Transformer Backbones for Object Detection Yanghao Li Hanzi Mao Ross B. Girshick Kaiming He ViT 47 789 0 30 Mar 2022
Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection Jinyuan Liu Xin-Yue Fan Zhanbo Huang Guanyao Wu Risheng Liu Wei Zhong Zhongxuan Luo 68 450 0 30 Mar 2022
Masked-attention Mask Transformer for Universal Image Segmentation Bowen Cheng Ishan Misra Alex Schwing Alexander Kirillov Rohit Girdhar ISeg 171 2,315 0 02 Dec 2021
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 356 7,600 0 11 Nov 2021
LLVIP: A Visible-infrared Paired Dataset for Low-light Vision Xinyu Jia Chuang Zhu Minzhen Li Wenqi Tang Shengjie Liu Wenli Zhou 31 349 0 24 Aug 2021
BEiT: BERT Pre-Training of Image Transformers Hangbo Bao Li Dong Songhao Piao Furu Wei ViT 144 2,785 0 15 Jun 2021
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers Enze Xie Wenhai Wang Zhiding Yu Anima Anandkumar J. Álvarez Ping Luo ViT 116 4,934 0 31 May 2021
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 537 5,920 0 29 Apr 2021
LasHeR: A Large-scale High-diversity Benchmark for RGBT Tracking Chenglong Li Wanli Xue Yaqing Jia Zhichen Qu Bin Luo Jin Tang Dengdi Sun 3DV 191 166 0 27 Apr 2021
An Empirical Study of Training Self-Supervised Vision Transformers Xinlei Chen Saining Xie Kaiming He ViT 110 1,837 0 05 Apr 2021
Training data-efficient image transformers & distillation through attention Hugo Touvron Matthieu Cord Matthijs Douze Francisco Massa Alexandre Sablayrolles Hervé Jégou ViT 255 6,657 0 23 Dec 2020
Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Crowd Counting Lingbo Liu Jiaqi Chen Hefeng Wu Guanbin Li Chenglong Li Liang Lin 73 110 0 08 Dec 2020
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai ... Matthias Minderer G. Heigold Sylvain Gelly Jakob Uszkoreit N. Houlsby ViT 234 40,217 0 22 Oct 2020
LSOTB-TIR:A Large-Scale High-Diversity Thermal Infrared Object Tracking Benchmark Qiao Liu Xin Li Zhenyu He Chenglong Li Jun Li ... Di Yuan Jing Li Kai-Bo Yang Nana Fan Feng Zheng 54 90 0 03 Aug 2020
RGBT Salient Object Detection: A Large-scale Dataset and Benchmark Zhengzheng Tu Yan Ma Zhun Li Chenglong Li Jieming Xu Yongtao Liu 3DV 11 157 0 07 Jul 2020
End-to-End Object Detection with Transformers Nicolas Carion Francisco Massa Gabriel Synnaeve Nicolas Usunier Alexander Kirillov Sergey Zagoruyko ViT 3DV PINN 237 12,847 0 26 May 2020
Drone-based RGB-Infrared Cross-Modality Vehicle Detection via Uncertainty-Aware Learning Yiming Sun Bing Cao Pengfei Zhu Q. Hu 50 244 0 05 Mar 2020
PyTorch: An Imperative Style, High-Performance Deep Learning Library Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury ... Sasank Chilamkurthy Benoit Steiner Lu Fang Junjie Bai Soumith Chintala ODL 166 42,038 0 03 Dec 2019
Segmenting Objects in Day and Night:Edge-Conditioned CNN for Thermal Image Semantic Segmentation Chenglong Li W. Xia Yan Yan Bin Luo Jin Tang 36 119 0 24 Jul 2019
Similarity of Neural Network Representations Revisited Simon Kornblith Mohammad Norouzi Honglak Lee Geoffrey E. Hinton 115 1,382 0 01 May 2019
Rain Removal in Traffic Surveillance: Does it Matter? C. Bahnsen T. Moeslund 21 91 0 30 Oct 2018
Unified Perceptual Parsing for Scene Understanding Tete Xiao Yingcheng Liu Bolei Zhou Yuning Jiang Jian Sun OCL VOS 93 1,859 0 26 Jul 2018
RGB-T Object Tracking:Benchmark and Baseline Chenglong Li Xinyan Liang Yijuan Lu Nan Zhao Jin Tang 43 412 0 23 May 2018
Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation Liang-Chieh Chen Yukun Zhu George Papandreou Florian Schroff Hartwig Adam SSeg 100 13,005 0 07 Feb 2018
Billion-scale similarity search with GPUs Jeff Johnson Matthijs Douze Hervé Jégou 149 3,682 0 28 Feb 2017
Pyramid Scene Parsing Network Hengshuang Zhao Jianping Shi Xiaojuan Qi Xiaogang Wang Jiaya Jia VOS SSeg 276 11,941 0 04 Dec 2016
Fully Convolutional Networks for Semantic Segmentation Evan Shelhamer Jonathan Long Trevor Darrell VOS SSeg 255 37,704 0 20 May 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 1.2K 192,638 0 10 Dec 2015
Distilling the Knowledge in a Neural Network Geoffrey E. Hinton Oriol Vinyals J. Dean FedML 169 19,448 0 09 Mar 2015
Microsoft COCO: Common Objects in Context Nayeon Lee Michael Maire Serge J. Belongie Lubomir Bourdev Ross B. Girshick James Hays Pietro Perona Deva Ramanan C. L. Zitnick Piotr Dollár ObjD 215 43,290 0 01 May 2014