v1v2v3 (latest)

Masked-attention Mask Transformer for Universal Image Segmentation

2 December 2021

Papers citing "Masked-attention Mask Transformer for Universal Image Segmentation"

50 / 1,408 papers shown

Title
SIM: Semantic-aware Instance Mask Generation for Box-Supervised Instance Segmentation Ruihuang Li Chenhang He Yabin Zhang Shuai Li Liyi Chen Lei Zhang ISeg 90 16 0 14 Mar 2023
Challenges and Practices of Deep Learning Model Reengineering: A Case Study on Computer Vision Wenxin Jiang Vishnu Banna Naveen Vivek Abhinav Goel Nicholas Synovic George K. Thiruvathukal James C. Davis VLM 81 23 0 13 Mar 2023
MP-Former: Mask-Piloted Transformer for Image Segmentation Hao Zhang Feng Li Hu-Sheng Xu Shijia Huang Siyi Liu L. Ni Lei Zhang ViT MedIm 113 60 0 13 Mar 2023
Lite DETR : An Interleaved Multi-Scale Encoder for Efficient DETR Feng Li Ailing Zeng Siyi Liu Hao Zhang Hongyang Li Lei Zhang L. Ni ViT 89 71 0 13 Mar 2023
Parallel Vertex Diffusion for Unified Visual Grounding Ze-Long Cheng Kehan Li Peng Jin Xiang Ji Li-ming Yuan Chang-rui Liu Jie Chen DiffM 106 26 0 13 Mar 2023
OSIS: Efficient One-stage Network for 3D Instance Segmentation Chuan Tang Xi Yang ISeg 3DV 112 2 0 13 Mar 2023
Object-Centric Multi-Task Learning for Human Instances Hyeongseok Son Sang-Il Jung Solae Lee Seong-heum Kim Seungsang Park ByungIn Yoo 3DH 128 0 0 13 Mar 2023
Universal Instance Perception as Object Discovery and Retrieval B. Yan Yi Jiang Jiannan Wu D. Wang Ping Luo Zehuan Yuan Huchuan Lu VOS VLM LRM 148 176 0 12 Mar 2023
Towards Universal Vision-language Omni-supervised Segmentation Bowen Dong Jiaxi Gu Jianhua Han Hang Xu W. Zuo VLM 100 1 0 12 Mar 2023
Dynamic Y-KD: A Hybrid Approach to Continual Instance Segmentation M. Fortin B. Chaib-draa CLL 79 1 0 10 Mar 2023
Structural Multiplane Image: Bridging Neural View Synthesis and 3D Reconstruction Mingfang Zhang Jinglu Wang Xiao Li Yifei Huang Yoichi Sato Yan Lu 68 11 0 10 Mar 2023
Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models Jiarui Xu Sifei Liu Arash Vahdat Wonmin Byeon Xiaolong Wang Shalini De Mello VLM 288 336 0 08 Mar 2023
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding Minyoung Hwang Jaeyeon Jeong Minsoo Kim Yoonseon Oh Songhwai Oh 84 21 0 07 Mar 2023
Detecting Human-Object Contact in Images Yixin Chen Sai Kumar Dwivedi Michael J. Black Dimitrios Tzionas 3DH 140 32 0 06 Mar 2023
Masked Images Are Counterfactual Samples for Robust Fine-tuning Yao Xiao Ziyi Tang Pengxu Wei Cong Liu Liang Lin 131 19 0 06 Mar 2023
UniHCP: A Unified Model for Human-Centric Perceptions Yuanzheng Ci Yizhou Wang Meilin Chen Shixiang Tang Lei Bai Feng Zhu Rui Zhao F. Yu Donglian Qi Wanli Ouyang 139 52 0 06 Mar 2023
Traffic Scene Parsing through the TSP6K Dataset Peng-Tao Jiang Yuqi Yang Yang Cao Qibin Hou Ming-Ming Cheng Chunhua Shen ViT 70 2 0 06 Mar 2023
Prismer: A Vision-Language Model with Multi-Task Experts Shikun Liu Linxi Fan Edward Johns Zhiding Yu Chaowei Xiao Anima Anandkumar VLM MLLM 142 25 0 04 Mar 2023
DejaVu: Conditional Regenerative Learning to Enhance Dense Prediction Shubhankar Borse Debasmit Das Hyojin Park H. Cai Risheek Garrepalli Fatih Porikli 123 10 0 02 Mar 2023
Delivering Arbitrary-Modal Semantic Segmentation Jiaming Zhang R. Liu Haowen Shi Kailun Yang Simon Reiß Kunyu Peng Haodong Fu Kaiwei Wang Rainer Stiefelhagen VLM 116 100 0 02 Mar 2023
Grid-Centric Traffic Scenario Perception for Autonomous Driving: A Comprehensive Review Yining Shi Kun Jiang Jiusi Li Zelin Qian Jun Wen Mengmeng Yang Ke Wang Diange Yang 165 30 0 02 Mar 2023
ISBNet: a 3D Point Cloud Instance Segmentation Network with Instance-aware Sampling and Box-aware Dynamic Convolution T.D. Ngo Binh-Son Hua Khoi Duc Minh Nguyen 3DPC ISeg 115 47 0 01 Mar 2023
MateRobot: Material Recognition in Wearable Robotics for People with Visual Impairments Junwei Zheng Jiaming Zhang Kailun Yang Kunyu Peng Rainer Stiefelhagen 74 10 0 28 Feb 2023
LMSeg: Language-guided Multi-dataset Segmentation Qiang-feng Zhou Yuang Liu Chaohui Yu Jingliang Li Zhibin Wang Fan Wang VLM 89 19 0 27 Feb 2023
Side Adapter Network for Open-Vocabulary Semantic Segmentation Mengde Xu Zheng Zhang Fangyun Wei Han Hu Xiang Bai VLM 87 272 0 23 Feb 2023
Structure Embedded Nucleus Classification for Histopathology Images Wei Lou Xiang Wan Guanbin Li X. Lou Chenghang Li Feng Gao Haofeng Li 84 10 0 22 Feb 2023
Transformadores: Fundamentos teoricos y Aplicaciones J. D. L. Torre 171 0 0 18 Feb 2023
LDFA: Latent Diffusion Face Anonymization for Self-driving Applications Marvin Klemp Kevin Rösch Royden Wagner Jannik Quehl Martin Lauer DiffM 92 23 0 17 Feb 2023
MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation Omer Bar-Tal Lior Yariv Y. Lipman Tali Dekel 91 395 1 16 Feb 2023
Object-centric Learning with Cyclic Walks between Parts and Whole Ziyu Wang Mike Zheng Shou Mengmi Zhang OCL 85 11 0 16 Feb 2023
ConceptFusion: Open-set Multimodal 3D Mapping Krishna Murthy Jatavallabhula Ali Kuwajerwala Qiao Gu Mohd. Omama Tao Chen ... Celso Miguel de Melo Madhava Krishna Liam Paull Florian Shkurti Antonio Torralba 116 246 0 14 Feb 2023
Semantic Image Segmentation: Two Decades of Research G. Csurka Riccardo Volpi Boris Chidlovskii 3DV 94 53 0 13 Feb 2023
Jaccard Metric Losses: Optimizing the Jaccard Index with Soft Labels Zifu Wang Xuefei Ning Matthew B. Blaschko VLM 114 15 0 11 Feb 2023
Self-Supervised Unseen Object Instance Segmentation via Long-Term Robot Interaction Ya Lu Ninad Khargonkar Zesheng Xu Charles Averill Kamalesh Palanisamy Kaiyu Hang Yunhui Guo Nicholas Ruozzi Yu Xiang 90 11 0 07 Feb 2023
Boosting Low-Data Instance Segmentation by Unsupervised Pre-training with Saliency Prompt Hao Li Dingwen Zhang Nian Liu Lechao Cheng Yalun Dai Chaoxi Zhang Xinggang Wang Junwei Han 81 18 0 02 Feb 2023
Maximal Cliques on Multi-Frame Proposal Graph for Unsupervised Video Object Segmentation Jialing Yuan Jay Patravali Hung Nguyen Chanho Kim Fuxin Li VOS 88 4 0 29 Jan 2023
CancerUniT: Towards a Single Unified Model for Effective Detection, Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection of CT Scans Jieneng Chen Yingda Xia Jiawen Yao K. Yan Jianpeng Zhang ... Xin Chen Jingren Zhou Alan Yuille Zai-De Liu Ling Zhang ViT MedIm 79 15 0 28 Jan 2023
Zorro: the masked multimodal transformer Adrià Recasens Jason Lin João Carreira Drew Jaegle Luyu Wang ... Pauline Luc Antoine Miech Lucas Smaira Ross Hemsley Andrew Zisserman 92 21 0 23 Jan 2023
Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic Segmentation S. D. Dao Hengcan Shi Dinh Q. Phung Jianfei Cai VLM 59 0 0 18 Jan 2023
Linguistic Query-Guided Mask Generation for Referring Image Segmentation Zhichao Wei Xiaohao Chen Mingqiang Chen Siyu Zhu VLM 120 1 0 16 Jan 2023
Scene-Aware 3D Multi-Human Motion Capture from a Single Camera D. Luvizon Marc Habermann Vladislav Golyanik Adam Kortylewski Christian Theobalt 3DH HAI 72 19 0 12 Jan 2023
Head-Free Lightweight Semantic Segmentation with Linear Transformer B. Dong Pichao Wang Fan Wang ViT 78 75 0 11 Jan 2023
CARD: Semantic Segmentation with Efficient Class-Aware Regularized Decoder Ye Huang Di Kang Liang Chen W. Jia Xiangjian He Lixin Duan Xuefei Zhe Linchao Bao 102 4 0 11 Jan 2023
On Advantages of Mask-level Recognition for Outlier-aware Segmentation Matej Grcić Josip vSarić Sinivsa vSegvić UQCV 166 34 0 09 Jan 2023
All in Tokens: Unifying Output Space of Visual Tasks via Soft Token Jia Ning Chen Li Zheng Zhang Zigang Geng Qi Dai Kun He Han Hu 130 47 0 05 Jan 2023
Reference Twice: A Simple and Unified Baseline for Few-Shot Instance Segmentation Yue Han Jiangning Zhang Zhucun Xue Chao Xu Xintian Shen Yabiao Wang Chengjie Wang Yong Liu Xiangtai Li 102 17 0 03 Jan 2023
PanopticPartFormer++: A Unified and Decoupled View for Panoptic Part Segmentation Xiangtai Li Shilin Xu Yibo Yang Haobo Yuan Guangliang Cheng Yu Tong Zhouchen Lin Ming-Hsuan Yang Dacheng Tao ViT 160 21 0 03 Jan 2023
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation Jianzong Wu Xiangtai Li Henghui Ding Xia Li Guangliang Cheng Yu Tong Chen Change Loy VLM 180 31 0 02 Jan 2023
Deep Learning Technique for Human Parsing: A Survey and Outlook Lu Yang Wenhe Jia Shane Li Q. Song ViT 143 20 0 01 Jan 2023
PanDepth: Joint Panoptic Segmentation and Depth Completion J. Lagos Esa Rahtu 3DPC VLM 83 1 0 29 Dec 2022