MoVie: Revisiting Modulated Convolutions for Visual Counting and Beyond

24 April 2020

Papers citing "MoVie: Revisiting Modulated Convolutions for Visual Counting and Beyond"

7 / 7 papers shown

Title
PaLI-X: On Scaling up a Multilingual Vision and Language Model Xi Chen Josip Djolonga Piotr Padlewski Basil Mustafa Soravit Changpinyo ... Mojtaba Seyedhosseini A. Angelova Xiaohua Zhai N. Houlsby Radu Soricut VLM 62 187 0 29 May 2023
MLIM: Vision-and-Language Model Pre-training with Masked Language and Image Modeling Tarik Arici M. S. Seyfioglu T. Neiman Yi Tian Xu Son N. Tran Trishul Chilimbi Belinda Zeng Ismail B. Tutar VLM 10 15 0 24 Sep 2021
Cross-Modal Retrieval Augmentation for Multi-Modal Classification Shir Gur Natalia Neverova C. Stauffer Ser-Nam Lim Douwe Kiela A. Reiter 14 26 0 16 Apr 2021
ImVoteNet: Boosting 3D Object Detection in Point Clouds with Image Votes C. Qi Xinlei Chen Or Litany Leonidas J. Guibas 3DPC 195 248 0 29 Jan 2020
Aggregated Residual Transformations for Deep Neural Networks Saining Xie Ross B. Girshick Piotr Dollár Z. Tu Kaiming He 297 10,220 0 16 Nov 2016
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 158 1,464 0 06 Jun 2016
Improving neural networks by preventing co-adaptation of feature detectors Geoffrey E. Hinton Nitish Srivastava A. Krizhevsky Ilya Sutskever Ruslan Salakhutdinov VLM 266 7,636 0 03 Jul 2012