v1v2v3 (latest)

All Tokens Matter: Token Labeling for Training Better Vision Transformers

22 April 2021

ArXiv (abs)PDF HTML Github (427★)

Papers citing "All Tokens Matter: Token Labeling for Training Better Vision Transformers"

50 / 134 papers shown

Title
Token Transforming: A Unified and Training-Free Token Compression Framework for Vision Transformer Acceleration Fanhu Zeng Deli Yu Zhenglun Kong Hao Tang ViT 61 1 0 06 Jun 2025
Lossless Token Merging Even Without Fine-Tuning in Vision Transformers Jaeyeon Lee Dong-Wan Choi MoMe ViT 87 0 0 21 May 2025
Dual-level Fuzzy Learning with Patch Guidance for Image Ordinal Regression Chunlai Dong Haochao Ying Qibo Qiu Jinhong Wang Danny Chen Jian Wu 101 0 0 09 May 2025
Dynamic Accumulated Attention Map for Interpreting Evolution of Decision-Making in Vision Transformer Yi Liao Yongsheng Gao Weichuan Zhang 84 3 0 18 Mar 2025
Deepfake Detection with Spatio-Temporal Consistency and Attention Yunzhuo Chen Naveed Akhtar Nur Al Hasan Haldar Ajmal Mian 204 4 0 12 Feb 2025
Vision Transformer Neural Architecture Search for Out-of-Distribution Generalization: Benchmark and Insights Sy-Tuyen Ho Tuan Van Vo Somayeh Ebrahimkhani Ngai-Man Cheung 90 0 0 08 Jan 2025
Locality Alignment Improves Vision-Language Models Ian Covert Tony Sun James Zou Tatsunori Hashimoto VLM 267 7 0 14 Oct 2024
Token Pruning using a Lightweight Background Aware Vision Transformer Sudhakar Sah Ravish Kumar Honnesh Rohmetra Ehsan Saboori ViT 122 1 0 12 Oct 2024
DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation Soojin Jang Jungmin Yun Junehyoung Kwon Eunju Lee Youngbin Kim 104 3 0 24 Sep 2024
Efficient Training of Large Vision Models via Advanced Automated Progressive Learning Changlin Li Jiawei Zhang Sihao Lin Zongxin Yang Junwei Liang Xiaodan Liang Xiaojun Chang VLM 70 0 0 06 Sep 2024
TReX- Reusing Vision Transformer's Attention for Efficient Xbar-based Computing Abhishek Moitra Abhiroop Bhattacharjee Youngeun Kim Priyadarshini Panda ViT 69 2 0 22 Aug 2024
DeMansia: Mamba Never Forgets Any Tokens Ricky Fang Mamba 48 0 0 04 Aug 2024
Semantic Graph Consistency: Going Beyond Patches for Regularizing Self-Supervised Vision Transformers Chaitanya Devaguptapu Sumukh K. Aithal Shrinivas Ramasubramanian Moyuru Yamada Manohar Kaul ViT 92 0 0 18 Jun 2024
Configuring Data Augmentations to Reduce Variance Shift in Positional Embedding of Vision Transformers Bum Jun Kim Sang Woo Kim ViT 61 1 0 23 May 2024
Vision Transformer with Sparse Scan Prior Qihang Fan Huaibo Huang Mingrui Chen Ran He ViT 83 6 0 22 May 2024
Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens Qihang Fan Huaibo Huang Mingrui Chen Ran He 90 3 0 22 May 2024
Data-independent Module-aware Pruning for Hierarchical Vision Transformers Yang He Qiufeng Wang ViT 83 5 0 21 Apr 2024
Learning Correlation Structures for Vision Transformers Manjin Kim Paul Hongsuck Seo Cordelia Schmid Minsu Cho ViT 91 11 0 05 Apr 2024
A General and Efficient Training for Transformer via Token Expansion Wenxuan Huang Yunhang Shen Jiao Xie Baochang Zhang Gaoqi He Ke Li Xing Sun Shaohui Lin 109 3 0 31 Mar 2024
Enhancing Efficiency in Vision Transformer Networks: Design Techniques and Insights Moein Heidari Reza Azad Sina Ghorbani Kolahi René Arimond Leon Niggemeier ... Afshin Bozorgpour Ehsan Khodapanah Aghdam Amirhossein Kazerouni Ilker Hacihaliloglu Dorit Merhof 97 7 0 28 Mar 2024
Efficient and Effective Weakly-Supervised Action Segmentation via Action-Transition-Aware Boundary Alignment Angchi Xu Wei-Shi Zheng 88 5 0 28 Mar 2024
ViTAR: Vision Transformer with Any Resolution Qihang Fan Quanzeng You Xiaotian Han Yongfei Liu Yunzhe Tao Huaibo Huang Ran He Hongxia Yang ViT 90 16 0 27 Mar 2024
Heracles: A Hybrid SSM-Transformer Model for High-Resolution Image and Time-Series Analysis Badri N. Patro Suhas Ranganath Vinay P. Namboodiri Vijay Srinivas Agneeswaran 99 3 0 26 Mar 2024
Multi-criteria Token Fusion with One-step-ahead Attention for Efficient Vision Transformers Sanghyeok Lee Joonmyung Choi Hyunwoo J. Kim ViT 80 10 0 15 Mar 2024
ComFe: An Interpretable Head for Vision Transformers Evelyn J. Mannix H. Bondell Howard Bondell VLM ViT 88 1 0 07 Mar 2024
HyenaPixel: Global Image Context with Convolutions Julian Spravil Sebastian Houben Sven Behnke 44 1 0 29 Feb 2024
ClipFormer: Key-Value Clipping of Transformers on Memristive Crossbars for Write Noise Mitigation Abhiroop Bhattacharjee Abhishek Moitra Priyadarshini Panda CLIP 69 6 0 04 Feb 2024
Fully Attentional Networks with Self-emerging Token Labeling Bingyin Zhao Zhiding Yu Shiyi Lan Yutao Cheng A. Anandkumar Yingjie Lao Jose M. Alvarez 1.0K 6 0 08 Jan 2024
LF-ViT: Reducing Spatial Redundancy in Vision Transformer for Efficient Image Recognition Youbing Hu Yun Cheng Anqi Lu Zhiqiang Cao Dawei Wei Jie Liu Zhijun Li ViT 49 6 0 08 Jan 2024
TPC-ViT: Token Propagation Controller for Efficient Vision Transformer Wentao Zhu 88 2 0 03 Jan 2024
MobileVLM : A Fast, Strong and Open Vision Language Assistant for Mobile Devices Xiangxiang Chu Limeng Qiao Xinyang Lin Shuang Xu Yang Yang ... Fei Wei Xinyu Zhang Bo Zhang Xiaolin Wei Chunhua Shen MLLM 130 44 0 28 Dec 2023
Expediting Contrastive Language-Image Pretraining via Self-distilled Encoders Bumsoo Kim Jinhyung Kim Yeonsik Jo S. Kim VLM 98 4 0 19 Dec 2023
Auto-Prox: Training-Free Vision Transformer Architecture Search via Automatic Proxy Discovery Zimian Wei Lujun Li Peijie Dong Zheng Hui Anggeng Li Menglong Lu H. Pan Zhiliang Tian Dongsheng Li ViT 73 17 0 14 Dec 2023
Factorization Vision Transformer: Modeling Long Range Dependency with Local Window Cost Haolin Qin Daquan Zhou Tingfa Xu Ziyang Bian Jianan Li 76 9 0 14 Dec 2023
Advancing Vision Transformers with Group-Mix Attention Chongjian Ge Xiaohan Ding Zhan Tong Li Yuan Jiangliu Wang Yibing Song Ping Luo 171 18 0 26 Nov 2023
Pursing the Sparse Limitation of Spiking Deep Learning Structures Hao-Ran Cheng Jiahang Cao Erjia Xiao Mengshu Sun Le Yang Jize Zhang Xue Lin B. Kailkhura Kaidi Xu Renjing Xu 85 1 0 18 Nov 2023
SparseSpikformer: A Co-Design Framework for Token and Weight Pruning in Spiking Transformer Yue Liu Shanlin Xiao Bo Li Zhiyi Yu 76 3 0 15 Nov 2023
Explainability of Vision Transformers: A Comprehensive Review and New Perspectives Rojina Kashefi Leili Barekatain Mohammad Sabokrou Fatemeh Aghaeipoor ViT 105 10 0 12 Nov 2023
GTP-ViT: Efficient Vision Transformers via Graph-based Token Propagation Xuwei Xu Sen Wang Yudong Chen Yanping Zheng Zhewei Wei Jiajun Liu ViT 98 12 0 06 Nov 2023
Scattering Vision Transformer: Spectral Mixing Matters Badri N. Patro Vijay Srinivas Agneeswaran 112 15 0 02 Nov 2023
No Token Left Behind: Efficient Vision Transformer via Dynamic Token Idling Xuwei Xu Changlin Li Yudong Chen Xiaojun Chang Jiajun Liu Sen Wang ViT 68 6 0 09 Oct 2023
SemiReward: A General Reward Model for Semi-supervised Learning Siyuan Li Weiyang Jin Zedong Wang Fang Wu Zicheng Liu Cheng Tan Stan Z. Li 96 9 0 04 Oct 2023
PPT: Token Pruning and Pooling for Efficient Vision Transformers Xinjian Wu Fanhu Zeng Xiudong Wang Xinghao Chen ViT 95 27 0 03 Oct 2023
CAIT: Triple-Win Compression towards High Accuracy, Fast Inference, and Favorable Transferability For ViTs Ao Wang Hui Chen Zijia Lin Sicheng Zhao Jiawei Han Guiguang Ding ViT 56 6 0 27 Sep 2023
RMT: Retentive Networks Meet Vision Transformers Qihang Fan Huaibo Huang Mingrui Chen Hongmin Liu Ran He ViT 166 91 0 20 Sep 2023
A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking Lorenzo Papa Paolo Russo Irene Amerini Luping Zhou 98 46 0 05 Sep 2023
Revisiting Vision Transformer from the View of Path Ensemble Shuning Chang Pichao Wang Haowen Luo Fan Wang Mike Zheng Shou ViT 59 3 0 12 Aug 2023
RepViT: Revisiting Mobile CNN From ViT Perspective Ao Wang Hui Chen Zijia Lin Hengjun Pu Guiguang Ding 101 215 0 18 Jul 2023
Max-Margin Token Selection in Attention Mechanism Davoud Ataee Tarzanagh Yingcong Li Xuechen Zhang Samet Oymak 111 45 0 23 Jun 2023
Revisiting Token Pruning for Object Detection and Instance Segmentation Yifei Liu Mathias Gehrig Nico Messikommer Marco Cannici Davide Scaramuzza ViT VLM 112 27 0 12 Jun 2023