End-to-End Object Detection with Transformers

26 May 2020

Papers citing "End-to-End Object Detection with Transformers"

50 / 5,127 papers shown

Title
Attention for Image Registration (AiR): an unsupervised Transformer approach Zihao W. Wang H. Delingette ViT MedIm 25 7 0 05 May 2021
Visual Relationship Detection Using Part-and-Sum Transformers with Composite Queries Qingyi Dong Z. Tu Haofu Liao Yuting Zhang Vijay Mahadevan Stefano Soatto ViT 19 38 0 05 May 2021
Instances as Queries Yuxin Fang Shusheng Yang Xinggang Wang Yu Li Chen Fang Ying Shan Bin Feng Wenyu Liu ISeg 42 255 0 05 May 2021
TransHash: Transformer-based Hamming Hashing for Efficient Image Retrieval Yongbiao Chen Shenmin Zhang Fangxin Liu Zhigang Chang Mang Ye Zhengwei Qi Shanghai Jiao Tong University ViT 27 48 0 05 May 2021
Attention-based Stylisation for Exemplar Image Colourisation Marc Górriz Blanch Issa Khalifeh A. Smeaton Noel E. O'Connor M. Mrak 23 4 0 04 May 2021
Moving Towards Centers: Re-ranking with Attention and Memory for Re-identification Yunhao Zhou Yi Wang Lap-Pui Chau 49 10 0 04 May 2021
AGMB-Transformer: Anatomy-Guided Multi-Branch Transformer Network for Automated Evaluation of Root Canal Therapy Yunxiang Li G. Zeng Yifan Zhang Jun Wang Qianni Zhang ... Neng Xia Ruizi Peng Kai Tang Yaqi Wang Shuai Wang MedIm AI4CE 92 28 0 02 May 2021
Keypoint Transformer: Solving Joint Identification in Challenging Hands and Object Interactions for Accurate 3D Pose Estimation Shreyas Hampali S. Sarkar Mahdi Rad Vincent Lepetit 3DH 23 132 0 29 Apr 2021
HOTR: End-to-End Human-Object Interaction Detection with Transformers Bumsoo Kim Junhyun Lee Jaewoo Kang Eun-Sol Kim Hyunwoo J. Kim ViT 20 252 0 28 Apr 2021
ConTNet: Why not use convolution and transformer at the same time? Haotian Yan Zhe Li Weijian Li Changhu Wang Ming Wu Chuang Zhang ViT 12 76 0 27 Apr 2021
Dual Transformer for Point Cloud Analysis Xian-Feng Han Yi-Fei Jin Hui Cheng Guoqiang Xiao ViT 34 73 0 27 Apr 2021
MDETR -- Modulated Detection for End-to-End Multi-Modal Understanding Aishwarya Kamath Mannat Singh Yann LeCun Gabriel Synnaeve Ishan Misra Nicolas Carion ObjD VLM 57 858 0 26 Apr 2021
Vision Transformers with Patch Diversification Chengyue Gong Dilin Wang Meng Li Vikas Chandra Qiang Liu ViT 37 62 0 26 Apr 2021
Visformer: The Vision-friendly Transformer Zhengsu Chen Lingxi Xie Jianwei Niu Xuefeng Liu Longhui Wei Qi Tian ViT 114 209 0 26 Apr 2021
Diverse Image Inpainting with Bidirectional and Autoregressive Transformers Yingchen Yu Fangneng Zhan Rongliang Wu Jianxiong Pan Kaiwen Cui Shijian Lu Feiying Ma Xuansong Xie C. Miao ViT 29 149 0 26 Apr 2021
Visual Saliency Transformer Nian Liu Ni Zhang Kaiyuan Wan Ling Shao Junwei Han ViT 253 352 0 25 Apr 2021
Multiscale Vision Transformers Haoqi Fan Bo Xiong K. Mangalam Yanghao Li Zhicheng Yan Jitendra Malik Christoph Feichtenhofer ViT 42 1,221 0 22 Apr 2021
All Tokens Matter: Token Labeling for Training Better Vision Transformers Zihang Jiang Qibin Hou Li-xin Yuan Daquan Zhou Yujun Shi Xiaojie Jin Anran Wang Jiashi Feng ViT 14 203 0 22 Apr 2021
Sparse-shot Learning with Exclusive Cross-Entropy for Extremely Many Localisations Andreas Panteli Jonas Teuwen H. Horlings E. Gavves 21 3 0 21 Apr 2021
TransVG: End-to-End Visual Grounding with Transformers Jiajun Deng Zhengyuan Yang Tianlang Chen Wen-gang Zhou Houqiang Li ViT 21 329 0 17 Apr 2021
Pose Recognition with Cascade Transformers Ke Li Shijie Wang Xiang Zhang Yifan Xu Weijian Xu Z. Tu ViT 32 208 0 14 Apr 2021
HoughNet: Integrating near and long-range evidence for visual detection Nermin Samet Samet Hicsonmez Emre Akbas ObjD 21 10 0 14 Apr 2021
ViT-V-Net: Vision Transformer for Unsupervised Volumetric Medical Image Registration Junyu Chen Yufan He Eric C. Frey Ye Li Yong Du ViT MedIm 23 181 0 13 Apr 2021
Crossover Learning for Fast Online Video Instance Segmentation Shusheng Yang Yuxin Fang Xinggang Wang Yu Li Chen Fang Ying Shan Bin Feng Wenyu Liu 30 103 0 13 Apr 2021
VR3Dense: Voxel Representation Learning for 3D Object Detection and Monocular Dense Depth Reconstruction Shubham Shrivastava 3DPC MDE 28 1 0 13 Apr 2021
Escaping the Big Data Paradigm with Compact Transformers Ali Hassani Steven Walton Nikhil Shah Abulikemu Abuduweili Jiachen Li Humphrey Shi 54 462 0 12 Apr 2021
Location-Sensitive Visual Recognition with Cross-IOU Loss Kaiwen Duan Lingxi Xie H. Qi S. Bai Qingming Huang Q. Tian 27 30 0 11 Apr 2021
Learning Position and Target Consistency for Memory-based Video Object Segmentation Liucheng Hu Peng Zhang Bang Zhang Pan Pan Yinghui Xu R. L. Jin VOS 24 111 0 09 Apr 2021
Seeing Out of tHe bOx: End-to-End Pre-training for Vision-Language Representation Learning Zhicheng Huang Zhaoyang Zeng Yupan Huang Bei Liu Dongmei Fu Jianlong Fu VLM ViT 34 271 0 07 Apr 2021
Facial Attribute Transformers for Precise and Robust Makeup Transfer Zhaoyi Wan Haoran Chen Jielei Zhang Wentao Jiang Cong Yao Jiebo Luo ViT 39 22 0 07 Apr 2021
Efficient DETR: Improving End-to-End Object Detector with Dense Prior Z. Yao Jiangbo Ai Boxun Li Chi Zhang ViT 42 213 0 03 Apr 2021
AAformer: Auto-Aligned Transformer for Person Re-Identification Kuan Zhu Haiyun Guo Shiliang Zhang Yaowei Wang Jing Liu Jinqiao Wang Ming Tang ViT 35 111 0 02 Apr 2021
Bridging Global Context Interactions for High-Fidelity Image Completion Chuanxia Zheng Tat-Jen Cham Jianfei Cai Dinh Q. Phung ViT 35 78 0 02 Apr 2021
The surprising impact of mask-head architecture on novel class segmentation Vighnesh Birodkar Zhichao Lu Siyang Li V. Rathod Jonathan Huang ISeg 30 27 0 01 Apr 2021
Going deeper with Image Transformers Hugo Touvron Matthieu Cord Alexandre Sablayrolles Gabriel Synnaeve Hervé Jégou ViT 25 986 0 31 Mar 2021
On the Robustness of Vision Transformers to Adversarial Examples Kaleel Mahmood Rigel Mahmood Marten van Dijk ViT 20 217 0 31 Mar 2021
Boundary IoU: Improving Object-Centric Image Segmentation Evaluation Bowen Cheng Ross B. Girshick Piotr Dollár Alexander C. Berg A. Kirillov 32 280 0 30 Mar 2021
Rethinking Spatial Dimensions of Vision Transformers Byeongho Heo Sangdoo Yun Dongyoon Han Sanghyuk Chun Junsuk Choe Seong Joon Oh ViT 334 564 0 30 Mar 2021
ViViT: A Video Vision Transformer Anurag Arnab Mostafa Dehghani G. Heigold Chen Sun Mario Lucic Cordelia Schmid ViT 30 2,086 0 29 Mar 2021
On the Adversarial Robustness of Vision Transformers Rulin Shao Zhouxing Shi Jinfeng Yi Pin-Yu Chen Cho-Jui Hsieh ViT 27 137 0 29 Mar 2021
Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding Pengchuan Zhang Xiyang Dai Jianwei Yang Bin Xiao Lu Yuan Lei Zhang Jianfeng Gao ViT 23 328 0 29 Mar 2021
TransCenter: Transformers with Dense Representations for Multiple-Object Tracking Yihong Xu Yutong Ban Guillaume Delorme Chuang Gan Daniela Rus Xavier Alameda-Pineda VOT 25 92 0 28 Mar 2021
Exploiting Temporal Contexts with Strided Transformer for 3D Human Pose Estimation Wenhao Li Hong Liu Runwei Ding Mengyuan Liu Pichao Wang Wenming Yang ViT 19 189 0 26 Mar 2021
COTR: Correspondence Transformer for Matching Across Images Wei Jiang Eduard Trulls J. Hosang Andrea Tagliasacchi K. M. Yi ViT 44 258 0 25 Mar 2021
Describing and Localizing Multiple Changes with Transformers Yue Qiu Shintaro Yamamoto Kodai Nakashima Ryota Suzuki K. Iwata Hirokatsu Kataoka Y. Satoh 25 55 0 25 Mar 2021
High-Fidelity Pluralistic Image Completion with Transformers Ziyu Wan Jingbo Zhang Dongdong Chen Jing Liao ViT 23 231 0 25 Mar 2021
Multi-view 3D Reconstruction with Transformer Dan Wang Xinrui Cui Xun Chen Zhengxia Zou Tianyang Shi Septimiu Salcudean Z. J. Wang Rabab Ward ViT 20 87 0 24 Mar 2021
BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture Search Changlin Li Tao Tang Guangrun Wang Jiefeng Peng Bing Wang Xiaodan Liang Xiaojun Chang ViT 46 105 0 23 Mar 2021
Instance-level Image Retrieval using Reranking Transformers Fuwen Tan Jiangbo Yuan Vicente Ordonez ViT 21 89 0 22 Mar 2021
End-to-End Trainable Multi-Instance Pose Estimation with Transformers Lucas Stoffl Maxime Vidal Alexander Mathis ViT 21 49 0 22 Mar 2021