Perceiver: General Perception with Iterative Attention

4 March 2021

Papers citing "Perceiver: General Perception with Iterative Attention"

50 / 682 papers shown

Title
GateHUB: Gated History Unit with Background Suppression for Online Action Detection Junwen Chen Gaurav Mittal Ye Yu Yu Kong Mei Chen 41 33 0 09 Jun 2022
Revealing Single Frame Bias for Video-and-Language Learning Jie Lei Tamara L. Berg Joey Tianyi Zhou 24 110 0 07 Jun 2022
Fair Classification via Transformer Neural Networks: Case Study of an Educational Domain Modar Sulaiman Kallol Roy 14 0 0 03 Jun 2022
SymFormer: End-to-end symbolic regression using transformer-based architecture Martin Vastl Jonáš Kulhánek Jiří Kubalík Erik Derner Robert Babuška 27 43 0 31 May 2022
Temporal Latent Bottleneck: Synthesis of Fast and Slow Processing Mechanisms in Sequence Learning Aniket Didolkar Kshitij Gupta Anirudh Goyal Nitesh B. Gundavarapu Alex Lamb Nan Rosemary Ke Yoshua Bengio AI4CE 115 17 0 30 May 2022
Multimodal Masked Autoencoders Learn Transferable Representations Xinyang Geng Hao Liu Lisa Lee Dale Schuurams Sergey Levine Pieter Abbeel 26 113 0 27 May 2022
Transformer for Partial Differential Equations' Operator Learning Zijie Li Kazem Meidani A. Farimani 42 140 0 26 May 2022
Semi-Parametric Inducing Point Networks and Neural Processes R. Rastogi Yair Schiff Alon Hacohen Zhaozhi Li I-Hsiang Lee Yuntian Deng M. Sabuncu Volodymyr Kuleshov 3DPC 24 6 0 24 May 2022
Dynamic Query Selection for Fast Visual Perceiver Corentin Dancette Matthieu Cord 30 1 0 22 May 2022
Equivariant Mesh Attention Networks Sourya Basu Jose Gallego-Posada Francesco Vigano J. Rowbottom Taco S. Cohen 3DPC MDE AI4CE 48 10 0 21 May 2022
Visual Concepts Tokenization Tao Yang Yuwang Wang Yan Lu Nanning Zheng OCL ViT 40 12 0 20 May 2022
Towards Unified Keyframe Propagation Models Patrick Esser Peter Michael Soumyadip Sengupta VGen 25 0 0 19 May 2022
Meta-Learning Sparse Compression Networks Jonathan Richard Schwarz Yee Whye Teh 56 25 0 18 May 2022
Vision Transformer Adapter for Dense Predictions Zhe Chen Yuchen Duan Wenhai Wang Junjun He Tong Lu Jifeng Dai Yu Qiao 43 543 0 17 May 2022
CONSENT: Context Sensitive Transformer for Bold Words Classification Ionut Sandu Daniel Voinea A. Popa 21 3 0 16 May 2022
ImageSig: A signature transform for ultra-lightweight image recognition Mohamed Ramzy Ibrahim Terry Lyons VLM 19 7 0 13 May 2022
Cross Domain Object Detection by Target-Perceived Dual Branch Distillation Meng He Yali Wang Jiaxi Wu Yiru Wang Hanqing Li Bo-wen Li Weihao Gan Wei Wu Yu Qiao 28 69 0 03 May 2022
Flamingo: a Visual Language Model for Few-Shot Learning Jean-Baptiste Alayrac Jeff Donahue Pauline Luc Antoine Miech Iain Barr ... Mikolaj Binkowski Ricardo Barreira Oriol Vinyals Andrew Zisserman Karen Simonyan MLLM VLM 46 3,334 0 29 Apr 2022
Autonomous In-Situ Soundscape Augmentation via Joint Selection of Masker and Gain Karn N. Watcharasupat Kenneth Ooi Bhan Lam Trevor Wong Zhen-Ting Ong W. Gan 37 8 0 29 Apr 2022
Pseudo strong labels for large scale weakly supervised audio tagging Heinrich Dinkel Zhiyong Yan Yongqing Wang Junbo Zhang Yujun Wang 28 6 0 28 Apr 2022
The Wisdom of Crowds: Temporal Progressive Attention for Early Action Prediction Alexandros Stergiou Dima Damen AI4TS EgoV EDL 17 7 0 28 Apr 2022
Attention Mechanism in Neural Networks: Where it Comes and Where it Goes Derya Soydaner 3DV 44 149 0 27 Apr 2022
Revealing Occlusions with 4D Neural Fields Basile Van Hoorick Purva Tendulkar Dídac Surís Dennis Park Simon Stent Carl Vondrick 22 16 0 22 Apr 2022
Future Object Detection with Spatiotemporal Transformers Adam Tonderski Joakim Johnander Christoffer Petersson Kalle AAstrom ViT 23 0 0 21 Apr 2022
Visio-Linguistic Brain Encoding S. Oota Jashn Arora Vijay Rowtula Manish Gupta R. Bapi AI4CE 14 15 0 18 Apr 2022
Visual Attention Methods in Deep Learning: An In-Depth Survey Mohammed Hassanin Saeed Anwar Ibrahim Radwan F. Khan Ajmal Saeed Mian 26 145 0 16 Apr 2022
Malceiver: Perceiver with Hierarchical and Multi-modal Features for Android Malware Detection Niall McLaughlin 28 2 0 12 Apr 2022
Probabilistic Compositional Embeddings for Multimodal Image Retrieval Andrei Neculai Yanbei Chen Zeynep Akata CoGe 25 31 0 12 Apr 2022
Linear Complexity Randomized Self-attention Mechanism Lin Zheng Chong-Jun Wang Lingpeng Kong 20 31 0 10 Apr 2022
MAESTRO: Matched Speech Text Representations through Modality Matching Zhehuai Chen Yu Zhang Andrew Rosenberg Bhuvana Ramabhadran Pedro J. Moreno Ankur Bapna Heiga Zen 17 106 0 07 Apr 2022
Event Transformer. A sparse-aware solution for efficient event data processing Alberto Sabater Luis Montesano Ana C. Murillo 29 51 0 07 Apr 2022
ReSTR: Convolution-free Referring Image Segmentation Using Transformers N. Kim Dongwon Kim Cuiling Lan Wenjun Zeng Suha Kwak 21 136 0 31 Mar 2022
RFNet-4D++: Joint Object Reconstruction and Flow Estimation from 4D Point Clouds with Cross-Attention Spatio-Temporal Features Tuan-Anh Vu D. Nguyen Binh-Son Hua Quang-Cuong Pham Sai-Kit Yeung 3DPC 55 4 0 30 Mar 2022
Unsupervised Learning of Temporal Abstractions with Slot-based Transformers Anand Gopalakrishnan Kazuki Irie Jürgen Schmidhuber Sjoerd van Steenkiste OffRL 26 16 0 25 Mar 2022
Transform your Smartphone into a DSLR Camera: Learning the ISP in the Wild A. S. Tripathi Martin Danelljan Samarth Shukla Radu Timofte Luc Van Gool 33 9 0 20 Mar 2022
Integrating Language Guidance into Vision-based Deep Metric Learning Karsten Roth Oriol Vinyals Zeynep Akata VLM 14 29 0 16 Mar 2022
Do BERTs Learn to Use Browser User Interface? Exploring Multi-Step Tasks with Unified Vision-and-Language BERTs Taichi Iki Akiko Aizawa LLMAG 16 6 0 15 Mar 2022
Masked Autoencoders for Point Cloud Self-supervised Learning Yatian Pang Wenxiao Wang Francis E. H. Tay Wei Liu Yonghong Tian Liuliang Yuan 3DPC ViT 33 454 0 13 Mar 2022
Block-Recurrent Transformers DeLesley S. Hutchins Imanol Schlag Yuhuai Wu Ethan Dyer Behnam Neyshabur 20 94 0 11 Mar 2022
Geodesic Multi-Modal Mixup for Robust Fine-Tuning Changdae Oh Junhyuk So Hoyoon Byun Yongtaek Lim Minchul Shin Jong-June Jeon Kyungwoo Song 33 26 0 08 Mar 2022
High-Modality Multimodal Transformer: Quantifying Modality & Interaction Heterogeneity for High-Modality Representation Learning Paul Pu Liang Yiwei Lyu Xiang Fan Jeffrey Tsaw Yudong Liu Shentong Mo Dani Yogatama Louis-Philippe Morency Ruslan Salakhutdinov 17 29 0 02 Mar 2022
Temporal Perceiver: A General Architecture for Arbitrary Boundary Detection Jing Tan Yuhong Wang Gangshan Wu Limin Wang 43 14 0 01 Mar 2022
Retriever: Learning Content-Style Representation as a Token-Level Bipartite Graph Dacheng Yin Xuanchi Ren Chong Luo Yuwang Wang Zhiwei Xiong Wenjun Zeng 47 13 0 24 Feb 2022
Measuring CLEVRness: Blackbox testing of Visual Reasoning Models Spyridon Mouselinos Henryk Michalewski Mateusz Malinowski 13 3 0 24 Feb 2022
Learning to Merge Tokens in Vision Transformers Cédric Renggli André Susano Pinto N. Houlsby Basil Mustafa J. Puigcerver C. Riquelme MoMe 19 56 0 24 Feb 2022
Better Modelling Out-of-Distribution Regression on Distributed Acoustic Sensor Data Using Anchored Hidden State Mixup Hasan Asy’ari Arief P. J. Thomas T. Wiktorski OOD 18 4 0 23 Feb 2022
HiP: Hierarchical Perceiver João Carreira Skanda Koppula Daniel Zoran Adrià Recasens Catalin Ionescu ... M. Botvinick Oriol Vinyals Karen Simonyan Andrew Zisserman Andrew Jaegle VLM 31 14 0 22 Feb 2022
Transformer Quality in Linear Time Weizhe Hua Zihang Dai Hanxiao Liu Quoc V. Le 78 222 0 21 Feb 2022
General-purpose, long-context autoregressive modeling with Perceiver AR Curtis Hawthorne Andrew Jaegle Cătălina Cangea Sebastian Borgeaud C. Nash ... Hannah R. Sheahan Neil Zeghidour Jean-Baptiste Alayrac João Carreira Jesse Engel 37 65 0 15 Feb 2022
SpeechPainter: Text-conditioned Speech Inpainting Zalan Borsos Matthew Sharifi Marco Tagliasacchi 16 25 0 15 Feb 2022