Multi-Scale High-Resolution Vision Transformer for Semantic Segmentation

1 November 2021

Papers citing "Multi-Scale High-Resolution Vision Transformer for Semantic Segmentation"

35 / 35 papers shown

Title
Part-Whole Relational Fusion Towards Multi-Modal Scene Understanding Yi Liu Chengxin Li Shoukun Xu J. Han ViT 42 2 0 19 Oct 2024
Multi-Scale Fusion for Object Representation Rongzhen Zhao V. Wang Arno Solin Joni Pajarinen OCL VOS 68 1 0 02 Oct 2024
iSeg: An Iterative Refinement-based Framework for Training-free Segmentation Lin Sun Jiale Cao J. Xie F. Khan Yanwei Pang DiffM 43 1 0 05 Sep 2024
Implicit and Explicit Language Guidance for Diffusion-based Visual Perception Hefeng Wang Jiale Cao Jin Xie Aiping Yang Yanwei Pang VLM DiffM 50 2 0 11 Apr 2024
HIRI-ViT: Scaling Vision Transformer with High Resolution Inputs Ting Yao Yehao Li Yingwei Pan Tao Mei ViT 28 15 0 18 Mar 2024
Minimalist and High-Performance Semantic Segmentation with Plain Vision Transformers Yuanduo Hong Jue Wang Weichao Sun Huihui Pan VLM ViT 37 7 0 19 Oct 2023
EViT: An Eagle Vision Transformer with Bi-Fovea Self-Attention Yulong Shi Mingwei Sun Yongshuai Wang Hui Sun Zengqiang Chen 34 4 0 10 Oct 2023
Edge-aware Feature Aggregation Network for Polyp Segmentation Tao Zhou Yizhe Zhang Geng Chen Yi Zhou Ye Wu Deng-Ping Fan 130 6 0 19 Sep 2023
Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP Qihang Yu Ju He XueQing Deng Xiaohui Shen Liang-Chieh Chen VLM CLIP 39 136 0 04 Aug 2023
Multi-scale Adaptive Fusion Network for Hyperspectral Image Denoising Haodong Pan Feng Gao Junyu Dong Q. Du 33 12 0 19 Apr 2023
Continual Semantic Segmentation with Automatic Memory Sample Selection Lanyun Zhu Tianrun Chen Jianxiong Yin Simon See Xiaozhong Liu CLL VLM 19 44 0 11 Apr 2023
HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for Medical Image Segmentation Xiaofei Huang Hongfang Gong Jin Zhang MedIm 26 2 0 10 Apr 2023
High-level Feature Guided Decoding for Semantic Segmentation Ye Huang Di Kang Shenghua Gao Wen Li Lixin Duan 23 0 0 15 Mar 2023
Adjacent-Level Feature Cross-Fusion With 3-D CNN for Remote Sensing Image Change Detection Y. Ye Mengmeng Wang Liang Zhou Guangyang Lei Jianwei Fan Yao Qin 3DPC 19 37 0 10 Feb 2023
ProtoSeg: Interpretable Semantic Segmentation with Prototypical Parts Mikolaj Sacha Dawid Rymarczyk Lukasz Struski Jacek Tabor Bartosz Zieliñski VLM 32 29 0 28 Jan 2023
Skip-Attention: Improving Vision Transformers by Paying Less Attention Shashanka Venkataramanan Amir Ghodrati Yuki M. Asano Fatih Porikli A. Habibian ViT 18 25 0 05 Jan 2023
Representation Separation for Semantic Segmentation with Vision Transformers Yuanduo Hong Huihui Pan Weichao Sun Xinghu Yu Huijun Gao ViT 28 5 0 28 Dec 2022
SMMix: Self-Motivated Image Mixing for Vision Transformers Mengzhao Chen Mingbao Lin Zhihang Lin Yu-xin Zhang Rongrong Ji Rongrong Ji 53 10 0 26 Dec 2022
GPViT: A High Resolution Non-Hierarchical Vision Transformer with Group Propagation Chenhongyi Yang Jiarui Xu Shalini De Mello Elliot J. Crowley Xinyu Wang ViT 38 21 0 13 Dec 2022
ZegCLIP: Towards Adapting CLIP for Zero-shot Semantic Segmentation Ziqi Zhou Bowen Zhang Yinjie Lei Lingqiao Liu Yifan Liu VLM 35 167 0 07 Dec 2022
Prototypical Residual Networks for Anomaly Detection and Localization H. Zhang Zuxuan Wu Zhilin Wang Zhineng Chen Yuwei Jiang UQCV AI4TS 35 62 0 05 Dec 2022
MPCViT: Searching for Accurate and Efficient MPC-Friendly Vision Transformer with Heterogeneous Attention Wenyuan Zeng Meng Li Wenjie Xiong Tong Tong Wen-jie Lu Jin Tan Runsheng Wang Ru Huang 24 20 0 25 Nov 2022
Hybrid Transformer Based Feature Fusion for Self-Supervised Monocular Depth Estimation S. Tomar Maitreya Suin A. N. Rajagopalan ViT MDE 24 4 0 20 Nov 2022
XRBench: An Extended Reality (XR) Machine Learning Benchmark Suite for the Metaverse Hyoukjun Kwon Krishnakumar Nair Jamin Seo Jason Yik D. Mohapatra ... Ashish Sirasao T. Krishna Harshit Khaitan Vikas Chandra Vijay Janapa Reddi 38 33 0 16 Nov 2022
Efficient High-Resolution Deep Learning: A Survey Arian Bakhtiarnia Qi Zhang Alexandros Iosifidis MedIm 21 19 0 26 Jul 2022
Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation Jiaming Zhang Kailun Yang Haowen Shi Simon Reiß Kunyu Peng Chaoxiang Ma Haodong Fu Philip H. S. Torr Kaiwei Wang Rainer Stiefelhagen ViT MDE 31 36 0 25 Jul 2022
High-Resolution Swin Transformer for Automatic Medical Image Segmentation Chen Wei Shenghan Ren Kaitai Guo Haihong Hu Jimin Liang ViT OOD MedIm 22 36 0 23 Jul 2022
HiFormer: Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation Moein Heidari A. Kazerouni Milad Soltany Kadarvish Reza Azad Ehsan Khodapanah Aghdam Julien Cohen-Adad Dorit Merhof MedIm ViT 25 178 0 18 Jul 2022
Improving Semantic Segmentation in Transformers using Hierarchical Inter-Level Attention Gary Leung Jun Gao Fangyin Wei Sanja Fidler 21 3 0 05 Jul 2022
Transformer Scale Gate for Semantic Segmentation Hengcan Shi Munawar Hayat Jianfei Cai ViT 32 22 0 14 May 2022
AggPose: Deep Aggregation Vision Transformer for Infant Pose Estimation Xu Cao Xiaoye Li Liya Ma Yi Huang X. Feng Zening Chen H. Zeng Jianguo Cao ViT 13 21 0 11 May 2022
A large scale multi-view RGBD visual affordance learning dataset Z. Khalifa Syed Afaq Ali Shah 3DV 24 5 0 26 Mar 2022
SAC-GAN: Structure-Aware Image Composition Hang Zhou Rui Ma Ling-Xiao Zhang Lina Gao Ali Mahdavi-Amiri Haotong Zhang GAN 35 7 0 13 Dec 2021
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 283 3,623 0 24 Feb 2021
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation Vijay Badrinarayanan Alex Kendall R. Cipolla SSeg 446 15,639 0 02 Nov 2015