Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model

27 June 2024

Xiangtai Li

Tao Zhang

Chen Change Loy

Papers citing "Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model"

50 / 76 papers shown

Title
Linear Attention Modeling for Learned Image Compression Donghui Feng Zhengxue Cheng Shen Wang Ronghua Wu Hongwei Hu Guo Lu Li Song 287 1 0 09 Feb 2025
VMamba: Visual State Space Model Yue Liu Yunjie Tian Yuzhong Zhao Hongtian Yu Lingxi Xie Yaowei Wang Qixiang Ye Jianbin Jiao Yunfan Liu Mamba 244 683 0 31 Dec 2024
COCONut: Modernizing COCO Segmentation XueQing Deng Qihang Yu Peng Wang Xiaohui Shen Liang-Chieh Chen 63 17 0 12 Apr 2024
HGRN2: Gated Linear RNNs with State Expansion Zhen Qin Aaron Courville Weixuan Sun Xuyang Shen Dong Li Weigao Sun Yiran Zhong LRM 65 51 0 11 Apr 2024
Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence Bo Peng Daniel Goldstein Quentin G. Anthony Alon Albalak Eric Alcaide ... Bingchen Zhao Qihang Zhao Peng Zhou Jian Zhu Ruijie Zhu 65 78 0 08 Apr 2024
ViTamin: Designing Scalable Vision Models in the Vision-Language Era Jienneg Chen Qihang Yu Xiaohui Shen Alan Yuille Liang-Chieh Chen 3DV VLM 83 25 0 02 Apr 2024
Rethinking Interactive Image Segmentation with Low Latency, High Quality, and Diverse Prompts Qin Liu Jaemin Cho Mohit Bansal Marc Niethammer VLM 64 10 0 31 Mar 2024
Segment Anything Model for Road Network Graph Extraction Congrui Hetang Haoru Xue Cindy X. Le Tianwei Yue Wenping Wang Yihui He 95 15 0 24 Mar 2024
VideoMamba: State Space Model for Efficient Video Understanding Kunchang Li Xinhao Li Yi Wang Yinan He Yali Wang Limin Wang Yu Qiao Mamba 54 200 0 11 Mar 2024
Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like Architectures Yuchen Duan Weiyun Wang Zhe Chen Xizhou Zhu Lewei Lu Tong Lu Yu Qiao Hongsheng Li Jifeng Dai Wenhai Wang ViT 60 45 0 04 Mar 2024
Point Cloud Mamba: Point Cloud Learning via State Space Model Tao Zhang Xiangtai Li Haobo Yuan Shunping Ji Shuicheng Yan 72 20 0 01 Mar 2024
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model Lianghui Zhu Bencheng Liao Qian Zhang Xinlong Wang Wenyu Liu Xinggang Wang Mamba 88 768 0 17 Jan 2024
Open-Vocabulary SAM: Segment and Recognize Twenty-thousand Classes Interactively Haobo Yuan Xiangtai Li Chong Zhou Yining Li Kai Chen Chen Change Loy VLM 69 51 0 05 Jan 2024
BA-SAM: Scalable Bias-Mode Attention Mask for Segment Anything Model Yiran Song Qianyu Zhou Hefei Ling Deng-Ping Fan Xuequan Lu Lizhuang Ma VLM 70 14 0 04 Jan 2024
SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process Meng Wang Henghui Ding Jun Hao Liew Jiajun Liu Yao-Min Zhao Yunchao Wei DiffM 52 18 0 19 Dec 2023
EdgeSAM: Prompt-In-the-Loop Distillation for On-Device Deployment of SAM Chong Zhou Xiangtai Li Chen Change Loy Bo Dai VLM 66 47 0 11 Dec 2023
Gated Linear Attention Transformers with Hardware-Efficient Training Aaron Courville Bailin Wang Songlin Yang Yikang Shen Yoon Kim 69 169 0 11 Dec 2023
EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything Yunyang Xiong Bala Varadarajan Lemeng Wu Xiaoyu Xiang Fanyi Xiao ... Dilin Wang Fei Sun Forrest N. Iandola Raghuraman Krishnamoorthi Vikas Chandra VLM 78 151 0 01 Dec 2023
Mamba: Linear-Time Sequence Modeling with Selective State Spaces Albert Gu Tri Dao Mamba 124 2,636 0 01 Dec 2023
Hierarchically Gated Recurrent Neural Network for Sequence Modeling Zhen Qin Aaron Courville Yiran Zhong 41 77 0 08 Nov 2023
ReMaX: Relaxing for Better Training on Efficient Panoptic Segmentation Shuyang Sun Weijun Wang Qihang Yu Andrew G. Howard Philip Torr Liang-Chieh Chen 75 15 0 29 Jun 2023
Faster Segment Anything: Towards Lightweight SAM for Mobile Applications Chaoning Zhang Dongshen Han Yu Qiao Jung Uk Kim Sung-Ho Bae Seungkyu Lee Choong Seon Hong VLM 78 346 0 25 Jun 2023
Fast Segment Anything Xu Zhao Wen-Yan Ding Yongqi An Yinglong Du Tao Yu Min Li Ming Tang Jinqiao Wang MLLM VLM 66 274 0 21 Jun 2023
Segment Anything in High Quality Lei Ke Mingqiao Ye Martin Danelljan Yifan Liu Yu-Wing Tai Chi-Keung Tang Feng Yu VLM 99 329 0 02 Jun 2023
RWKV: Reinventing RNNs for the Transformer Era Bo Peng Eric Alcaide Quentin G. Anthony Alon Albalak Samuel Arcadinho ... Qihang Zhao P. Zhou Qinghua Zhou Jian Zhu Rui-Jie Zhu 198 593 0 22 May 2023
Transformer-Based Visual Segmentation: A Survey Xiangtai Li Henghui Ding Haobo Yuan Wenwei Zhang Jiangmiao Pang Guangliang Cheng Kai-xiang Chen Ziwei Liu Chen Change Loy ViT MedIm 91 143 0 19 Apr 2023
Segment Anything A. Kirillov Eric Mintun Nikhila Ravi Hanzi Mao Chloe Rolland ... Spencer Whitehead Alexander C. Berg Wan-Yen Lo Piotr Dollár Ross B. Girshick MLLM VLM 306 7,213 0 05 Apr 2023
MobileInst: Video Instance Segmentation on the Mobile Renhong Zhang Tianheng Cheng Shusheng Yang Hao Jiang Shuai Zhang ... Xin Li Xiaowen Ying Dashan Gao Wenyu Liu Xinggang Wang 70 7 0 30 Mar 2023
You Only Segment Once: Towards Real-Time Panoptic Segmentation Jie Hu Linyan Huang Tianhe Ren Shengchuan Zhang Rongrong Ji Liujuan Cao SSeg 73 58 0 26 Mar 2023
Rethinking Mobile Block for Efficient Attention-based Models Jiangning Zhang Xiangtai Li Jian Li Liang Liu Zhucun Xue Boshen Zhang Zhe Jiang Tianxin Huang Yabiao Wang Chengjie Wang MQ 74 97 0 03 Jan 2023
High-Quality Entity Segmentation Lu Qi Jason Kuen Weidong Guo Tiancheng Shen Jiuxiang Gu Jiaya Jia Zhe Lin Ming-Hsuan Yang ISeg 60 52 0 10 Nov 2022
Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios Jiashi Li Xin Xia W. Li Huixia Li Xing Wang Xuefeng Xiao Rui Wang Min Zheng Xin Pan ViT 44 152 0 12 Jul 2022
EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for Mobile Vision Applications Muhammad Maaz Abdelrahman M. Shaker Hisham Cholakkal Salman Khan Syed Waqas Zamir Rao Muhammad Anwer Fahad Shahbaz Khan ViT 86 195 0 21 Jun 2022
MoCoViT: Mobile Convolutional Vision Transformer Hailong Ma Xin Xia Xing Wang Xuefeng Xiao Jiashi Li Min Zheng ViT 93 18 0 25 May 2022
EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers Junting Pan Adrian Bulat Fuwen Tan Xiatian Zhu Łukasz Dudziak Hongsheng Li Georgios Tzimiropoulos Brais Martínez ViT 63 189 0 06 May 2022
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation Wenqiang Zhang Zilong Huang Guozhong Luo Tao Chen Xinggang Wang Wenyu Liu Gang Yu Chunhua Shen ViT 82 206 0 12 Apr 2022
Exploring Plain Vision Transformer Backbones for Object Detection Yanghao Li Hanzi Mao Ross B. Girshick Kaiming He ViT 77 802 0 30 Mar 2022
Highly Accurate Dichotomous Image Segmentation Xuebin Qin H. Dai Xiaobin Hu Deng-Ping Fan Ling Shao and Luc Van Gool 68 108 0 06 Mar 2022
TransVOD: End-to-End Video Object Detection with Spatial-Temporal Transformers Qianyu Zhou Hefei Ling Lu He Li Niu Guangliang Cheng Yunhai Tong Lizhuang Ma Liqing Zhang ViT 76 136 0 13 Jan 2022
Masked-attention Mask Transformer for Universal Image Segmentation Bowen Cheng Ishan Misra Alex Schwing Alexander Kirillov Rohit Girdhar ISeg 200 2,355 0 02 Dec 2021
High Quality Segmentation for Ultra High-resolution Images Tiancheng Shen Yuechen Zhang Lu Qi Jason Kuen Xingyu Xie Jianlong Wu Zhe Lin Jiaya Jia 137 42 0 29 Nov 2021
Mask Transfiner for High-Quality Instance Segmentation Lei Ke Martin Danelljan Xia Li Yu-Wing Tai Chi-Keung Tang Feng Yu ISeg 48 116 0 26 Nov 2021
Efficiently Modeling Long Sequences with Structured State Spaces Albert Gu Karan Goel Christopher Ré 184 1,761 0 31 Oct 2021
MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer Sachin Mehta Mohammad Rastegari ViT 280 1,264 0 05 Oct 2021
FaPN: Feature-aligned Pyramid Network for Dense Image Prediction Shihua Huang Zhichao Lu Ran Cheng Cheng He 40 206 0 16 Aug 2021
Mobile-Former: Bridging MobileNet and Transformer Yinpeng Chen Xiyang Dai Dongdong Chen Mengchen Liu Xiaoyi Dong Lu Yuan Zicheng Liu ViT 238 487 0 12 Aug 2021
Context-Aware Mixup for Domain Adaptive Semantic Segmentation Qianyu Zhou Zhengyang Feng Qiqi Gu Jiangmiao Pang Guangliang Cheng Xuequan Lu Jianping Shi Lizhuang Ma 115 131 0 08 Aug 2021
Open-World Entity Segmentation Lu Qi Jason Kuen Yi Wang Jiuxiang Gu Hengshuang Zhao Zhe Lin Philip Torr Jiaya Jia OCL SSeg VLM 68 82 0 29 Jul 2021
Per-Pixel Classification is Not All You Need for Semantic Segmentation Bowen Cheng Alex Schwing Alexander Kirillov VLM ViT 189 1,527 0 13 Jul 2021
Crossover Learning for Fast Online Video Instance Segmentation Shusheng Yang Yuxin Fang Xinggang Wang Yu Li Chen Fang Ying Shan Bin Feng Wenyu Liu 60 104 0 13 Apr 2021