Visual Transformer for Object Detection

1 June 2022

Papers citing "Visual Transformer for Object Detection"

25 / 25 papers shown

Title
ReFormer: The Relational Transformer for Image Captioning Xuewen Yang Yingru Liu Xin Wang ViT 76 56 0 29 Jul 2021
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Ze Liu Yutong Lin Yue Cao Han Hu Yixuan Wei Zheng Zhang Stephen Lin B. Guo ViT 447 21,439 0 25 Mar 2021
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 527 3,724 0 24 Feb 2021
Deformable DETR: Deformable Transformers for End-to-End Object Detection Xizhou Zhu Weijie Su Lewei Lu Bin Li Xiaogang Wang Jifeng Dai ViT 218 5,080 0 08 Oct 2020
Crossing-Domain Generative Adversarial Networks for Unsupervised Multi-Domain Image-to-Image Translation Xuewen Yang Dongliang Xie Xin Eric Wang GAN 54 39 0 27 Aug 2020
Learning Tuple Compatibility for Conditional OutfitRecommendation Xuewen Yang Dongliang Xie Xin Wang Jiangbo Yuan Wanying Ding Pengyun Yan 25 31 0 18 Aug 2020
Fashion Captioning: Towards Generating Accurate Descriptions with Semantic Rewards Xuewen Yang Heming Zhang Di Jin Yingru Liu Chi-Hao Wu Jianchao Tan Dongliang Xie Jue Wang Xin Wang 57 68 0 06 Aug 2020
Adaptive Activation Network and Functional Regularization for Efficient and Flexible Deep Multi-Task Learning Yingru Liu Xuewen Yang Dongliang Xie Xin Wang Li Shen Haozhi Huang Niranjan Balasubramanian 89 9 0 19 Nov 2019
Latent Part-of-Speech Sequences for Neural Machine Translation Xuewen Yang Yingru Liu Dongliang Xie Xin Wang Niranjan Balasubramanian 23 16 0 30 Aug 2019
Auto-Encoding Scene Graphs for Image Captioning Xu Yang Kaihua Tang Hanwang Zhang Jianfei Cai 154 699 0 06 Dec 2018
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 1.8K 94,891 0 11 Oct 2018
Exploring Visual Relationship for Image Captioning Ting Yao Yingwei Pan Yehao Li Tao Mei 76 834 0 19 Sep 2018
Revisiting Unreasonable Effectiveness of Data in Deep Learning Era Chen Sun Abhinav Shrivastava Saurabh Singh Abhinav Gupta VLM 188 2,401 0 10 Jul 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 701 131,652 0 12 Jun 2017
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dollár Ross B. Girshick ObjD 352 27,195 0 20 Mar 2017
Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning Jiasen Lu Caiming Xiong Devi Parikh R. Socher 128 1,452 0 06 Dec 2016
Fully Convolutional Networks for Semantic Segmentation Evan Shelhamer Jonathan Long Trevor Darrell VOS SSeg 741 37,862 0 20 May 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 2.2K 194,020 0 10 Dec 2015
You Only Look Once: Unified, Real-Time Object Detection Joseph Redmon S. Divvala Ross B. Girshick Ali Farhadi ObjD 699 36,958 0 08 Jun 2015
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren Kaiming He Ross B. Girshick Jian Sun AIMat ObjD 514 62,294 0 04 Jun 2015
Fast R-CNN Ross B. Girshick ObjD 303 25,059 0 30 Apr 2015
Adam: A Method for Stochastic Optimization Diederik P. Kingma Jimmy Ba ODL 1.8K 150,115 0 22 Dec 2014
Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan Andrew Zisserman FAtt MDE 1.6K 100,386 0 04 Sep 2014
Microsoft COCO: Common Objects in Context Nayeon Lee Michael Maire Serge J. Belongie Lubomir Bourdev Ross B. Girshick James Hays Pietro Perona Deva Ramanan C. L. Zitnick Piotr Dollár ObjD 413 43,667 0 01 May 2014
Rich feature hierarchies for accurate object detection and semantic segmentation Ross B. Girshick Jeff Donahue Trevor Darrell Jitendra Malik ObjD 289 26,193 0 11 Nov 2013