v1v2v3 (latest)

Masked-attention Mask Transformer for Universal Image Segmentation

2 December 2021

Papers citing "Masked-attention Mask Transformer for Universal Image Segmentation"

50 / 1,408 papers shown

Title
Revealing the Dark Secrets of Extremely Large Kernel ConvNets on Robustness Honghao Chen Yurong Zhang Xiaokun Feng Xiangxiang Chu Kaiqi Huang AAML 83 6 0 12 Jul 2024
Explore the Potential of CLIP for Training-Free Open Vocabulary Semantic Segmentation Tong Shao Zhuotao Tian Hang Zhao Jingyong Su VLM 114 16 0 11 Jul 2024
Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets Qin Lei Jiang Zhong Qizhu Dai DiffM 76 3 0 11 Jul 2024
ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation Ruijie Zhu Chuxin Wang Ziyang Song Li Liu Tianzhu Zhang Yongdong Zhang MDE 79 7 0 11 Jul 2024
Swiss DINO: Efficient and Versatile Vision Framework for On-device Personal Object Search Kirill Paramonov Jia-Xing Zhong Umberto Michieli J. Moon Mete Ozay 123 2 0 10 Jul 2024
Unified Embedding Alignment for Open-Vocabulary Video Instance Segmentation Hao Fang Peng Wu Yawei Li Xinxin Zhang Xiankai Lu VLM 93 7 0 10 Jul 2024
Learning Spatial-Semantic Features for Robust Video Object Segmentation Xin Li Deshui Miao Zhenyu He Yansen Wang Huchuan Lu Ming-Hsuan Yang VOS 171 4 0 10 Jul 2024
Visual-Geometry GP-based Navigable Space for Autonomous Navigation Mahmoud Ali Durgkant Pushp Zheng Chen Lantao Liu 61 0 0 09 Jul 2024
General and Task-Oriented Video Segmentation Mu Chen Liulei Li Wenguan Wang Ruijie Quan Yi Yang VOS 153 6 0 09 Jul 2024
Anatomy-guided Pathology Segmentation A. Jaus C. Seibold Simon Reiß Lukas Heine Anton Schily Moon Kim F. Bahnsen Ken Herrmann Rainer Stiefelhagen Jens Kleesiek MedIm 64 3 0 08 Jul 2024
MobilePortrait: Real-Time One-Shot Neural Head Avatars on Mobile Devices Jianwen Jiang Gaojie Lin Zhengkun Rong Chao Liang Yongming Zhu Jiaqi Yang Tianyun Zhong 3DH 145 9 0 08 Jul 2024
CPM: Class-conditional Prompting Machine for Audio-visual Segmentation Yuanhong Chen Chong Wang Yuyuan Liu Hu Wang Gustavo Carneiro 134 4 0 07 Jul 2024
SAM Fewshot Finetuning for Anatomical Segmentation in Medical Images Weiyi Xie Nathalie Willems Shubham Patil Yang Li Mayank Kumar 99 14 0 05 Jul 2024
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives Lia Morra A. Santangelo Pietro Basci Luca Piano Fabio Garcea Fabrizio Lamberti Massimo Leone 73 1 0 03 Jul 2024
CAVIS: Context-Aware Video Instance Segmentation Seunghun Lee Jiwan Seo Kiljoon Han Minwoo Choi S. Im VOS 87 0 0 03 Jul 2024
AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction Mustafa Khan H. Fazlali Dhruv Sharma Tongtong Cao Dongfeng Bai Y. Ren Bingbing Liu 3DGS 82 20 0 02 Jul 2024
Label Anything: Multi-Class Few-Shot Semantic Segmentation with Visual Prompts Pasquale De Marinis Nicola Fanelli Raffaele Scaringi Emanuele Colonna Giuseppe Fiameni G. Vessio Giovanna Castellano MLLM VLM 77 2 0 02 Jul 2024
A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling Minghao Zhou Hong Wang Yefeng Zheng Deyu Meng 230 2 0 02 Jul 2024
Label-free Neural Semantic Image Synthesis Jiayi Wang Kevin Laube Yumeng Li J. H. Metzen Shin-I Cheng Julio Borges Anna Khoreva DiffM 150 0 0 01 Jul 2024
AdaOcc: Adaptive Forward View Transformation and Flow Modeling for 3D Occupancy and Flow Prediction Dubing Chen Wencheng Han Jin Fang Jianbing Shen 54 0 0 01 Jul 2024
PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction Xuan Yu Yili Liu Chenrui Han Sitong Mao Shunbo Zhou R. Xiong Yiyi Liao Yue Wang ISeg 86 3 0 01 Jul 2024
Robot Instance Segmentation with Few Annotations for Grasping Moshe Kimhi David Vainshtein Chaim Baskin Dotan Di Castro 129 2 0 01 Jul 2024
Toward a Diffusion-Based Generalist for Dense Vision Tasks Yue Fan Yongqin Xian Xiaohua Zhai Alexander Kolesnikov Muhammad Ferjad Naeem Bernt Schiele Federico Tombari VLM MDE DiffM 60 1 0 29 Jun 2024
Segment Anything without Supervision Xudong Wang Jingfeng Yang Trevor Darrell VLM 121 15 0 28 Jun 2024
Fine-tuning of Geospatial Foundation Models for Aboveground Biomass Estimation Michal Muszynski Levente Klein Ademir Ferreira da Silva Anjani Prasad Atluri Carlos Gomes ... Shraddha Singh Steve Meliksetian Campbell Watson Daiki Kimura Harini Srinivasan 139 4 0 28 Jun 2024
PM-VIS+: High-Performance Video Instance Segmentation without Video Annotation Zhangjing Yang Dun Liu Xin Wang Zhe Li Barathwaj S. Anandan Yi Wu VLM VOS 61 0 0 28 Jun 2024
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding Tao Zhang Xiangtai Li Hao Fei Haobo Yuan Shengqiong Wu Shunping Ji Chen Change Loy Shuicheng Yan LRM MLLM VLM 141 63 0 27 Jun 2024
Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model Haobo Yuan Xiangtai Li Lu Qi Tao Zhang Ming-Hsuan Yang Shuicheng Yan Chen Change Loy VLM 118 10 0 27 Jun 2024
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges Robert-Jan Bruintjes A. Lengyel Marcos Baptista-Rios O. Kayhan Davide Zambrano Nergis Tomen Jan van Gemert VLM 96 0 0 26 Jun 2024
Diffusion Model-Based Video Editing: A Survey Wenhao Sun Rong-Cheng Tu Jingyi Liao Dacheng Tao VGen 118 25 0 26 Jun 2024
Depth-Guided Semi-Supervised Instance Segmentation Xin Chen Jie Hu Xiawu Zheng Jianghang Lin Liujuan Cao Rongrong Ji ISeg 3DV 84 1 0 25 Jun 2024
GMT: Guided Mask Transformer for Leaf Instance Segmentation Feng Chen Sotirios A. Tsaftaris M. Giuffrida 84 1 0 24 Jun 2024
PVUW 2024 Challenge on Complex Video Understanding: Methods and Results Henghui Ding Chang Liu Yunchao Wei Nikhila Ravi Shuting He ... Bo Zhao Jing Liu Feiyu Pan Hao Fang Xiankai Lu 110 8 0 24 Jun 2024
LOGCAN++: Adaptive Local-global class-aware network for semantic segmentation of remote sensing imagery Xiaowen Ma Rongrong Lian Zhenkai Wu Hongbo Guo Mengting Ma Sensen Wu Zhenhong Du Siyang Song Wei Zhang 237 5 0 24 Jun 2024
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation Thomas Stegmüller Tim Lebailly Nikola Dukic Behzad Bozorgtabar Tinne Tuytelaars Jean-Philippe Thiran VLM 109 1 0 23 Jun 2024
CholecInstanceSeg: A Tool Instance Segmentation Dataset for Laparoscopic Surgery Oluwatosin O. Alabi K. Toe Zijian Zhou Charlie Budd Nicholas Raison Miaojing Shi Tom Vercauteren ISeg 131 1 0 23 Jun 2024
Rethinking Remote Sensing Change Detection With A Mask View Xiaowen Ma Zhenkai Wu Rongrong Lian Wei Zhang Siyang Song 70 3 0 21 Jun 2024
TraceNet: Segment one thing efficiently Mingyuan Wu Zichuan Liu Haozhen Zheng Hongpeng Guo Bo Chen Xin Lu Klara Nahrstedt 111 0 0 21 Jun 2024
Reparameterizable Dual-Resolution Network for Real-time Semantic Segmentation Guoyu Yang Yuan Wang Daming Shi SSeg 83 1 0 18 Jun 2024
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation Jiho Choi Seonho Lee Seungho Lee Minhyun Lee Hyunjung Shim OCL 97 0 0 17 Jun 2024
Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation Bingfeng Zhang Siyue Yu Yunchao Wei Yao Zhao Jimin Xiao VLM 78 11 0 17 Jun 2024
PyramidMamba: Rethinking Pyramid Feature Fusion with Selective Space State Model for Semantic Segmentation of Remote Sensing Imagery Libo Wang Dongxu Li Sijun Dong Xiaoliang Meng Xiaokang Zhang Danfeng Hong 71 8 0 16 Jun 2024
MMVR: Millimeter-wave Multi-View Radar Dataset and Benchmark for Indoor Perception M. M. Rahman Ryoma Yataka Sorachi Kato Peng Wang Peizhao Li Adriano Cardace P. Boufounos 72 6 0 15 Jun 2024
Panoptic-FlashOcc: An Efficient Baseline to Marry Semantic Occupancy with Panoptic via Instance Center Zichen Yu Changyong Shu Qianpu Sun Junjie Linghu Xiaobao Wei Jiangyong Yu Zongdai Liu Dawei Yang Hui Li Yan Chen 61 5 0 15 Jun 2024
Task-aligned Part-aware Panoptic Segmentation through Joint Object-Part Representations Daan de Geus Gijs Dubbelman 109 0 0 14 Jun 2024
Understanding Pedestrian Movement Using Urban Sensing Technologies: The Promise of Audio-based Sensors Chaeyeon Han Pavan Seshadri Yiwei Ding Noah Posner B. Koo Animesh Agrawal Alexander Lerch S. Guhathakurta 55 2 0 14 Jun 2024
ALGM: Adaptive Local-then-Global Token Merging for Efficient Semantic Segmentation with Plain Vision Transformers Narges Norouzi Svetlana Orlova Daan de Geus Gijs Dubbelman ViT FedML 71 5 0 14 Jun 2024
Open-Vocabulary Semantic Segmentation with Image Embedding Balancing Xiangheng Shan Dongyue Wu Guilin Zhu Yuanjie Shao Nong Sang Changxin Gao VLM 84 18 0 14 Jun 2024
Depth Anything V2 Lihe Yang Bingyi Kang Zilong Huang Zhen Zhao Xiaogang Xu Jiashi Feng Hengshuang Zhao DiffM VLM MDE 131 437 0 13 Jun 2024
4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities Roman Bachmann Oğuzhan Fatih Kar David Mizrahi Ali Garjani Mingfei Gao David Griffiths Jiaming Hu Afshin Dehghan Amir Zamir MoE VLM MLLM 113 17 0 13 Jun 2024