v1v2v3 (latest)

Masked-attention Mask Transformer for Universal Image Segmentation

2 December 2021

Papers citing "Masked-attention Mask Transformer for Universal Image Segmentation"

50 / 1,408 papers shown

Title
Dynamic Prompting of Frozen Text-to-Image Diffusion Models for Panoptic Narrative Grounding Hongyu Li Tianrui Hui Zihan Ding Jing Zhang Bin Ma Xiaoming Wei Jizhong Han Si Liu DiffM 72 2 0 12 Sep 2024
LED: Light Enhanced Depth Estimation at Night Simon De Moreau Yasser Almehio Andrei Bursuc Hafid El-Idrissi B. Stanciulescu Fabien Moutarde 3DV 80 1 0 12 Sep 2024
UNIT: Unsupervised Online Instance Segmentation through Time Corentin Sautier Gilles Puy Alexandre Boulch Renaud Marlet Vincent Lepetit 97 1 0 12 Sep 2024
SURGIVID: Annotation-Efficient Surgical Video Object Discovery Çağhan Köksal Ghazal Ghazaei Nassir Navab 63 1 0 12 Sep 2024
A Likelihood Ratio-Based Approach to Segmenting Unknown Objects Nazir Nayal Youssef Shoeb Fatma Güney OODD 82 4 0 10 Sep 2024
KRONC: Keypoint-based Robust Camera Optimization for 3D Car Reconstruction Davide Di Nucci Alessandro Simoni Matteo Tomei L. Ciuffreda R. Vezzani Rita Cucchiara 3DPC 65 0 0 09 Sep 2024
Enhanced Generative Data Augmentation for Semantic Segmentation via Stronger Guidance Quang-Huy Che Duc-Tri Le Vinh-Tiep Nguyen D. Lam Vinh-Tiep Nguyen DiffM 255 1 0 09 Sep 2024
Advancing SEM Based Nano-Scale Defect Analysis in Semiconductor Manufacturing for Advanced IC Nodes Bappaditya Dey Matthias Monden Victor Blanco Sandip Halder S. de Gendt 58 0 0 06 Sep 2024
Towards Energy-Efficiency by Navigating the Trilemma of Energy, Latency, and Accuracy Boyuan Tian Yihan Pang Muhammad Huzaifa Shenlong Wang Sarita Adve 80 1 0 06 Sep 2024
FrozenSeg: Harmonizing Frozen Foundation Models for Open-Vocabulary Segmentation Xi Chen Haosen Yang Sheng Jin Xiatian Zhu Huanjin Yao VLM 101 3 0 05 Sep 2024
iSeg: An Iterative Refinement-based Framework for Training-free Segmentation Lin Sun Jiale Cao J. Xie Fahad Shahbaz Khan Yanwei Pang DiffM 102 1 0 05 Sep 2024
Segmenting Object Affordances: Reproducibility and Sensitivity to Scale Tommaso Apicella Alessio Xompero Paolo Gastaldo Andrea Cavallaro 72 2 0 03 Sep 2024
SAM4MLLM: Enhance Multi-Modal Large Language Model for Referring Expression Segmentation Yi-Chia Chen Wei-Hua Li Cheng Sun Yu-Chiang Frank Wang Chu-Song Chen VLM 108 21 0 01 Sep 2024
A Simple and Generalist Approach for Panoptic Segmentation Nedyalko Prisadnikov Wouter Van Gansbeke Danda Pani Paudel Luc Van Gool VLM 116 0 0 29 Aug 2024
DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries Yu Yang Jianbiao Mei Liang Liu Siliang Du Yilin Xiao Jongwon Ra Yong Liu Xiao Xu Huifeng Wu ISeg 106 0 0 28 Aug 2024
Applying ViT in Generalized Few-shot Semantic Segmentation Liyuan Geng Jinhong Xia Yuanhe Guo 62 1 0 27 Aug 2024
MROVSeg: Breaking the Resolution Curse of Vision-Language Models in Open-Vocabulary Semantic Segmentation Yuanbing Zhu Bingke Zhu Zhen Chen Huan Xu Ming Tang Jinqiao Wang VLM 72 0 0 27 Aug 2024
Physically Feasible Semantic Segmentation Shamik Basu Luc Van Gool Daniel Gehrig 216 1 0 26 Aug 2024
TC-PDM: Temporally Consistent Patch Diffusion Models for Infrared-to-Visible Video Translation Anh-Dzung Doan Vu Minh Hieu Phan Surabhi Gupta Markus Wagner Tat-Jun Chin Ian Reid VGen DiffM 81 0 0 26 Aug 2024
Localization and Expansion: A Decoupled Framework for Point Cloud Few-shot Semantic Segmentation Zhaoyang Li Yuan Wang Wangkai Li Rui Sun Tianzhu Zhang 101 2 0 25 Aug 2024
Segment Any Mesh George Tang William Zhao Logan Ford David Benhaim Paul Zhang 97 9 0 24 Aug 2024
Image Segmentation in Foundation Model Era: A Survey Tianfei Zhou Fei Zhang Boyu Chang Wenguan Wang Ye Yuan E. Konukoglu Daniel Cremers VLM 142 12 0 23 Aug 2024
Frequency-aware Feature Fusion for Dense Image Prediction Linwei Chen Ying Fu Lin Gu Chenggang Yan Tatsuya Harada Gao Huang 3DV 119 33 0 23 Aug 2024
Accuracy Improvement of Cell Image Segmentation Using Feedback Former Hinako Mitsuoka Kazuhiro Hotta ViT MedIm 246 0 0 23 Aug 2024
Sapiens: Foundation for Human Vision Models Rawal Khirodkar Timur M. Bagautdinov Julieta Martinez Su Zhaoen Austin James Peter Selednik Stuart Anderson Shunsuke Saito VLM 147 82 0 22 Aug 2024
Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets Wolfgang Boettcher Lukas Hoyer Ozan Unal J. E. Lenssen Bernt Schiele 62 0 0 22 Aug 2024
Multimodal Foundational Models for Unsupervised 3D General Obstacle Detection Tamás Matuszka Peter Hajas Dávid Szeghy 75 0 0 22 Aug 2024
SynPlay: Importing Real-world Diversity for a Synthetic Human Dataset Jinsub Yim Hyungtae Lee Sungmin Eum Yi-Ting Shen Yan Zhang Heesung Kwon Shuvra S. Bhattacharyya VGen 111 1 0 21 Aug 2024
On the Potential of Open-Vocabulary Models for Object Detection in Unusual Street Scenes Sadia Ilyas Ido Freeman Matthias Rottmann ObjD 107 3 0 20 Aug 2024
Rethinking Video Segmentation with Masked Video Consistency: Did the Model Learn as Intended? Chen Liang Qiang Guo Xiaochao Qu Luoqi Liu Ting Liu VOS 69 0 0 20 Aug 2024
GS-CPR: Efficient Camera Pose Refinement via 3D Gaussian Splatting Changkun Liu Shuai Chen Yash Bhalgat Siyan Hu Zirui Wang Ming Cheng V. Prisacariu Tristan Braud 3DGS 99 5 0 20 Aug 2024
OVOSE: Open-Vocabulary Semantic Segmentation in Event-Based Cameras Muhammad Rameez Ur Rahman Jhony H. Giraldo Indro Spinelli Stéphane Lathuilière Fabio Galasso VLM 65 0 0 18 Aug 2024
MaskBEV: Towards A Unified Framework for BEV Detection and Map Segmentation Xiao Zhao Xukun Zhang Dingkang Yang Mingyang Sun Mingcheng Li Shunli Wang Lihua Zhang MoE 92 1 0 17 Aug 2024
HSDreport: Heart Sound Diagnosis with Echocardiography Reports Zihan Zhao Pingjie Wang Liudan Zhao Yuchen Yang Ya Zhang Kun Sun Xin Sun Xin Zhou Yu Wang Yanfeng Wang 121 1 0 16 Aug 2024
Zero-Shot Dual-Path Integration Framework for Open-Vocabulary 3D Instance Segmentation Tri Ton Ji Woo Hong Soohwan Eom Jun Yeop Shim Junyeong Kim Chang D. Yoo 3DPC ISeg 67 2 0 16 Aug 2024
Tuning a SAM-Based Model with Multi-Cognitive Visual Adapter to Remote Sensing Instance Segmentation Linghao Zheng Xinyang Pu Feng Xu 61 3 0 16 Aug 2024
Towards Flexible Visual Relationship Segmentation Fangrui Zhu Jianwei Yang Huaizu Jiang VOS 100 2 0 15 Aug 2024
Surgical SAM 2: Real-time Segment Anything in Surgical Video by Efficient Frame Pruning Haofeng Liu Erli Zhang Junde Wu Mingxuan Hong Yueming Jin MedIm 99 21 0 15 Aug 2024
ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation Jingyun Wang Guoliang Kang VLM SSL 107 7 0 13 Aug 2024
MacFormer: Semantic Segmentation with Fine Object Boundaries Guoan Xu Wenfeng Huang Tao Wu Ligeng Chen Wenjing Jia Guangwei Gao Xiatian Zhu Stuart W. Perry 84 0 0 11 Aug 2024
Modeling Electromagnetic Signal Injection Attacks on Camera-based Smart Systems: Applications and Mitigation Youqian Zhang Michael Cheung Chunxi Yang Xinwei Zhai Zitong Shen Xinyu Ji Eugene Y. Fu Sze-Yiu Chau Xiapu Luo AAML 131 1 0 09 Aug 2024
In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation Dahyun Kang Minsu Cho ObjD VLM 140 11 0 09 Aug 2024
SAM2-Adapter: Evaluating & Adapting Segment Anything 2 in Downstream Tasks: Camouflage, Shadow, Medical Image Segmentation, and More Tianrun Chen Ankang Lu Lanyun Zhu Chaotao Ding Chunan Yu Deyi Ji Ziyue Li Lingyun Sun Papa Mao Ying Zang VLM MedIm 109 24 0 08 Aug 2024
MultiColor: Image Colorization by Learning from Multiple Color Spaces Xiangcheng Du Zhao Zhou Yanlong Wang Zhuoyao Wang Yingbin Zheng Cheng Jin 56 4 0 08 Aug 2024
Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery Jialang Xu Jiacheng Wang Lequan Yu Danail Stoyanov Yueming Jin E. Mazomenos 122 2 0 06 Aug 2024
Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization Changtao Miao Qi Chu Tao Gong Zhentao Tan Zhenchao Jin Wanyi Zhuang Man Luo Honggang Hu Nenghai Yu CVBM 93 3 0 05 Aug 2024
Unsupervised Domain Adaption Harnessing Vision-Language Pre-training Wenlve Zhou Zhiheng Zhou VLM 87 9 0 05 Aug 2024
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation Zili Wang Qi Yang Linsu Shi Jiazhong Yu M. Tanveer Fei Li Shiming Xiang VOS 64 1 0 03 Aug 2024
WAS: Dataset and Methods for Artistic Text Segmentation Xudong Xie Yuzhe Li Yang Liu Zhifei Zhang Zhaowen Wang Wei Xiong Xiang Bai DiffM 90 2 0 31 Jul 2024
Open-Vocabulary Audio-Visual Semantic Segmentation Zhenghao Zhang Junchao Liao Dantong Niu Yanyu Qi Menghao Li Ji Shi Bowei Xing Xianghua Ying VOS VLM 108 8 0 31 Jul 2024