v1v2 (latest)

Bottleneck Transformers for Visual Recognition

27 January 2021

Pieter Abbeel

Papers citing "Bottleneck Transformers for Visual Recognition"

50 / 339 papers shown

Title
SkelVIT: Consensus of Vision Transformers for a Lightweight Skeleton-Based Action Recognition System Özge Öztimur Karadag ViT MedIm 53 1 0 14 Nov 2023
Dual-channel Prototype Network for few-shot Classification of Pathological Images Hao Quan Xinjia Li Dayu Hu Tianhang Nan Xiaoyu Cui 64 0 0 14 Nov 2023
FMViT: A multiple-frequency mixing Vision Transformer Wei Tan Yifeng Geng Xuansong Xie ViT 82 4 0 09 Nov 2023
Selective Visual Representations Improve Convergence and Generalization for Embodied AI Ainaz Eftekhar Kuo-Hao Zeng Jiafei Duan Ali Farhadi Aniruddha Kembhavi Ranjay Krishna 109 17 0 07 Nov 2023
Scattering Vision Transformer: Spectral Mixing Matters Badri N. Patro Vijay Srinivas Agneeswaran 112 15 0 02 Nov 2023
Constructing Sample-to-Class Graph for Few-Shot Class-Incremental Learning Fuyuan Hu Jian Zhang Fan Lyu Linyan Li Fenglei Xu CLL 89 3 0 31 Oct 2023
Accelerating Vision Transformers Based on Heterogeneous Attention Patterns Deli Yu Teng Xi Jianwei Li Baopu Li Gang Zhang Haocheng Feng Junyu Han Jingtuo Liu Errui Ding Jingdong Wang ViT 81 1 0 11 Oct 2023
Plug n' Play: Channel Shuffle Module for Enhancing Tiny Vision Transformers Xuwei Xu Sen Wang Yudong Chen Jiajun Liu ViT 59 1 0 09 Oct 2023
Strength in Diversity: Multi-Branch Representation Learning for Vehicle Re-Identification Eurico Almeida Bruno Silva Jorge Batista 64 7 0 02 Oct 2023
OSNet & MNetO: Two Types of General Reconstruction Architectures for Linear Computed Tomography in Multi-Scenarios Zhisheng Wang Z. Deng Fenglin Liu Yixing Huang Haijun Yu Junning Cui 56 3 0 21 Sep 2023
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention Zhuofan Xia Xuran Pan Shiji Song Li Erran Li Gao Huang ViT 93 27 0 04 Sep 2023
QKSAN: A Quantum Kernel Self-Attention Network Ren-Xin Zhao Jinjing Shi Xuelong Li 96 25 0 25 Aug 2023
Learning Bottleneck Transformer for Event Image-Voxel Feature Fusion based Classification Chengguo Yuan Yu Jin Zong-Yao Wu Fanting Wei Yangzirui Wang Langlang Chen Tianlin Li ViT 144 7 0 23 Aug 2023
Patch Is Not All You Need Chang-bo Li Jie Zhang Yang Wei Zhilong Ji Jinfeng Bai Shiguang Shan ViT 69 2 0 21 Aug 2023
Transformer-based Detection of Microorganisms on High-Resolution Petri Dish Images Nikolas Ebert D. Stricker Oliver Wasenmüller MedIm ViT 69 5 0 18 Aug 2023
Distributionally Robust Classification on a Data Budget Ben Feuer Ameya Joshi Minh Pham Chinmay Hegde OOD 75 2 0 07 Aug 2023
Causal reasoning in typical computer vision tasks Kexuan Zhang Qiyu Sun Chaoqiang Zhao Yang Tang CML 97 13 0 26 Jul 2023
Regression-free Blind Image Quality Assessment with Content-Distortion Consistency Xiaoqi Wang Jian Xiong Hao Gao Weisi Lin 53 1 0 18 Jul 2023
PatchCT: Aligning Patch Set and Label Set with Conditional Transport for Multi-Label Image Classification Miaoge Li Dongsheng Wang Xinyang Liu Zequn Zeng Ruiying Lu Bo Chen Mingyuan Zhou VLM OT 112 15 0 18 Jul 2023
Scale-Aware Modulation Meet Transformer Wei-Shiang Lin Ziheng Wu Jiayu Chen Jun Huang Lianwen Jin MoE ViT 117 78 0 17 Jul 2023
ShiftNAS: Improving One-shot NAS via Probability Shift Mingyang Zhang Xinyi Yu Haodong Zhao Linlin Ou 101 6 0 17 Jul 2023
A Survey of Techniques for Optimizing Transformer Inference Krishna Teja Chitty-Venkata Sparsh Mittal M. Emani V. Vishwanath Arun Somani 129 75 0 16 Jul 2023
Marine Debris Detection in Satellite Surveillance using Attention Mechanisms Ao Shen Yijie Zhu Richard Jiang 95 8 0 09 Jul 2023
NAR-Former V2: Rethinking Transformer for Universal Neural Network Representation Learning Yun Yi Haokui Zhang Rong Xiao Nan Wang Xiaoyu Wang GNN 71 3 0 19 Jun 2023
Securing Visually-Aware Recommender Systems: An Adversarial Image Reconstruction and Detection Framework Minglei Yin Bin Liu Neil Zhenqiang Gong Xin Li AAML 55 1 0 11 Jun 2023
InvPT++: Inverted Pyramid Multi-Task Transformer for Visual Scene Understanding Hanrong Ye Dan Xu ViT 108 13 0 08 Jun 2023
CVSNet: A Computer Implementation for Central Visual System of The Brain Ruimin Gao Hao-Li Zou Zhekai Duan 77 3 0 31 May 2023
CageViT: Convolutional Activation Guided Efficient Vision Transformer Hao Zheng Jinbao Wang Xiantong Zhen Hao Chen Jingkuan Song Feng Zheng ViT 78 0 0 17 May 2023
CB-HVTNet: A channel-boosted hybrid vision transformer network for lymphocyte assessment in histopathological images Momina Liaqat Ali Zunaira Rauf Asifullah Khan A. Sohail Rafi Ullah Jeonghwan Gwak MedIm ViT 73 2 0 16 May 2023
Understanding Gaussian Attention Bias of Vision Transformers Using Effective Receptive Fields Bum Jun Kim Hyeyeon Choi Hyeonah Jang Sang Woo Kim ViT 61 3 0 08 May 2023
Early Detection of Alzheimer's Disease using Bottleneck Transformers Arunima Jaiswal Ananya Sadana MedIm 37 3 0 01 May 2023
Adaptive-Mask Fusion Network for Segmentation of Drivable Road and Negative Obstacle With Untrustworthy Features Zhen Feng Yuchao Feng Yanning Guo Yuxiang Sun 25 7 0 27 Apr 2023
AutoFocusFormer: Image Segmentation off the Grid Chen Ziwen K. Patnaik Shuangfei Zhai Alvin Wan Zhile Ren Alex Schwing Alex Colburn Li Fuxin 103 12 0 24 Apr 2023
MLP-AIR: An Efficient MLP-Based Method for Actor Interaction Relation Learning in Group Activity Recognition Guoliang Xu Jianqin Yin 60 1 0 18 Apr 2023
SpectFormer: Frequency and Attention is what you need in a Vision Transformer Badri N. Patro Vinay P. Namboodiri Vijay Srinivas Agneeswaran ViT 94 49 0 13 Apr 2023
Dynamic Mobile-Former: Strengthening Dynamic Convolution with Attention and Residual Connection in Kernel Space Seokju Yun Youngmin Ro ViT 54 2 0 13 Apr 2023
Life Regression based Patch Slimming for Vision Transformers Jiawei Chen Lin Chen Jianguo Yang Tianqi Shi Lechao Cheng Zunlei Feng Min-Gyoo Song ViT 60 5 0 11 Apr 2023
Co-attention Propagation Network for Zero-Shot Video Object Segmentation Gensheng Pei Yazhou Yao Fumin Shen Daniel Huang Xing-Rui Huang Hengtao Shen VOS 91 12 0 08 Apr 2023
Visual Dependency Transformers: Dependency Tree Emerges from Reversed Attention Mingyu Ding Songlin Yang Lijie Fan Zhenfang Chen Z. Chen Ping Luo J. Tenenbaum Chuang Gan ViT 157 15 0 06 Apr 2023
RFAConv: Innovating Spatial Attention and Standard Convolutional Operation Xinyu Zhang Chen Liu Degang Yang Tingting Song Yichen Ye Ke Li Ying Song 88 127 0 06 Apr 2023
ReBotNet: Fast Real-time Video Enhancement Jeya Maria Jose Valanarasu Rahul Garg Andeep S. Toor Xin Tong Weijuan Xi Andreas Lugmayr Vishal M. Patel A. Menini 81 1 0 23 Mar 2023
FER-former: Multi-modal Transformer for Facial Expression Recognition Yande Li Mingjie Wang Minglun Gong Y. Lu Li Liu 59 11 0 23 Mar 2023
Sparse-IFT: Sparse Iso-FLOP Transformations for Maximizing Training Efficiency Vithursan Thangarasa Shreyas Saxena Abhay Gupta Sean Lie 114 5 0 21 Mar 2023
CerviFormer: A Pap-smear based cervical cancer classification method using cross attention and latent transformer Bhaswati Singha Deo M. Pal P. Panigrahi A. Pradhan MedIm 43 25 0 17 Mar 2023
LoG-CAN: local-global Class-aware Network for semantic segmentation of remote sensing images Xiaowen Ma Mengting Ma Chenlu Hu Zhiyuan Song Zi-Shu Zhao Tian Feng Wei Zhang 100 13 0 14 Mar 2023
CrossFormer++: A Versatile Vision Transformer Hinging on Cross-scale Attention Wenxiao Wang Wei Chen Qibo Qiu Long Chen Boxi Wu Binbin Lin Xiaofei He Wei Liu 98 49 0 13 Mar 2023
RotoGBML: Towards Out-of-Distribution Generalization for Gradient-Based Meta-Learning Min Zhang Zifeng Zhuang Zhitao Wang Donglin Wang Wen-Bin Li 74 5 0 12 Mar 2023
Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks Jierun Chen Shiu-hong Kao Hao He Weipeng Zhuo Song Wen Chul-Ho Lee Shueng-Han Gary Chan OOD 122 883 0 07 Mar 2023
Self-attention in Vision Transformers Performs Perceptual Grouping, Not Attention Paria Mehrani John K. Tsotsos 92 25 0 02 Mar 2023
A Convolutional Vision Transformer for Semantic Segmentation of Side-Scan Sonar Data Hayat Rajani N. Gracias Rafael García ViT 57 14 0 24 Feb 2023