AssembleNet: Searching for Multi-Stream Neural Connectivity in Video Architectures

30 May 2019

Mingxing Tan

Papers citing "AssembleNet: Searching for Multi-Stream Neural Connectivity in Video Architectures"

33 / 33 papers shown

Title
Enhancing Video Understanding: Deep Neural Networks for Spatiotemporal Analysis Amir Hosein Fadaei M. Dehaqani 45 0 0 11 Feb 2025
TransNet: A Transfer Learning-Based Network for Human Action Recognition Khaled Alomar Xiaohao Cai 38 1 0 13 Sep 2023
IndGIC: Supervised Action Recognition under Low Illumination Jing-Teng Zeng 35 1 0 29 Aug 2023
FedMultimodal: A Benchmark For Multimodal Federated Learning Tiantian Feng Digbalay Bose Tuo Zhang Rajat Hebbar Anil Ramakrishna Rahul Gupta Mi Zhang Salman Avestimehr Shrikanth Narayanan 34 48 0 15 Jun 2023
VicTR: Video-conditioned Text Representations for Activity Recognition Kumara Kahatapitiya Anurag Arnab Arsha Nagrani Michael S. Ryoo 39 20 0 05 Apr 2023
Rethinking Video ViTs: Sparse Video Tubes for Joint Image and Video Learning A. Piergiovanni Weicheng Kuo A. Angelova ViT 36 54 0 06 Dec 2022
UniFormerV2: Spatiotemporal Learning by Arming Image ViTs with Video UniFormer Kunchang Li Yali Wang Yinan He Yizhuo Li Yi Wang Limin Wang Yu Qiao ViT 30 107 0 17 Nov 2022
Video Question Answering with Iterative Video-Text Co-Tokenization A. Piergiovanni K. Morton Weicheng Kuo Michael S. Ryoo A. Angelova 34 18 0 01 Aug 2022
Gate-Shift-Fuse for Video Action Recognition Swathikiran Sudhakaran Sergio Escalera Oswald Lanz 22 22 0 16 Mar 2022
Multiview Transformers for Video Recognition Shen Yan Xuehan Xiong Anurag Arnab Zhichao Lu Mi Zhang Chen Sun Cordelia Schmid ViT 26 212 0 12 Jan 2022
SVIP: Sequence VerIfication for Procedures in Videos Yichen Qian Weixin Luo Dongze Lian Xu Tang P. Zhao Shenghua Gao ViT 29 17 0 13 Dec 2021
Auto-X3D: Ultra-Efficient Video Understanding via Finer-Grained Neural Architecture Search Yi Ding Xinyu Gong Junru Wu Humphrey Shi Zhicheng Yan Zhangyang Wang VGen 52 1 0 09 Dec 2021
PolyViT: Co-training Vision Transformers on Images, Videos and Audio Valerii Likhosherstov Anurag Arnab K. Choromanski Mario Lucic Yi Tay Adrian Weller Mostafa Dehghani ViT 35 73 0 25 Nov 2021
An Analysis of Super-Net Heuristics in Weight-Sharing NAS Kaicheng Yu René Ranftl Mathieu Salzmann 31 6 0 04 Oct 2021
4D-Net for Learned Multi-Modal Alignment A. Piergiovanni Vincent Casser Michael S. Ryoo A. Angelova 3DPC 99 55 0 02 Sep 2021
LIGAR: Lightweight General-purpose Action Recognition Evgeny Izutov 15 3 0 30 Aug 2021
Searching for Two-Stream Models in Multivariate Space for Video Recognition Xinyu Gong Heng Wang Zheng Shou Matt Feiszli Zhangyang Wang Zhicheng Yan 39 9 0 30 Aug 2021
Attention Bottlenecks for Multimodal Fusion Arsha Nagrani Shan Yang Anurag Arnab A. Jansen Cordelia Schmid Chen Sun 25 543 0 30 Jun 2021
Can An Image Classifier Suffice For Action Recognition? Quanfu Fan Chun-Fu Chen Chen Yikang Shen ViT 34 33 0 26 Jun 2021
TokenLearner: What Can 8 Learned Tokens Do for Images and Videos? Michael S. Ryoo A. Piergiovanni Anurag Arnab Mostafa Dehghani A. Angelova ViT 37 127 0 21 Jun 2021
ViPNAS: Efficient Video Pose Estimation via Neural Architecture Search Lumin Xu Yingda Guan Sheng Jin Wentao Liu Chao Qian Ping Luo Wanli Ouyang Xiaogang Wang 31 52 0 21 May 2021
VPN++: Rethinking Video-Pose embeddings for understanding Activities of Daily Living Srijan Das Rui Dai Di Yang F. Brémond ViT 43 66 0 17 May 2021
ViViT: A Video Vision Transformer Anurag Arnab Mostafa Dehghani G. Heigold Chen Sun Mario Lucic Cordelia Schmid ViT 30 2,088 0 29 Mar 2021
Visionary: Vision architecture discovery for robot learning Iretiayo Akinola A. Angelova Yao Lu Yevgen Chebotar Dmitry Kalashnikov Jacob Varley Julian Ibarz Michael S. Ryoo 24 10 0 26 Mar 2021
Coarse-Fine Networks for Temporal Activity Detection in Videos Kumara Kahatapitiya Michael S. Ryoo AI4TS 53 38 0 01 Mar 2021
A Comprehensive Study of Deep Video Action Recognition Yi Zhu Xinyu Li Chunhui Liu Mohammadreza Zolfaghari Yuanjun Xiong Chongruo Wu Zhi-Li Zhang Joseph Tighe R. Manmatha Mu Li VLM AI4TS 38 185 0 11 Dec 2020
Deep Analysis of CNN-based Spatio-temporal Representations for Action Recognition Chun-Fu Chen Yikang Shen K. Ramakrishnan Rogerio Feris J. M. Cohn A. Oliva Quanfu Fan 23 95 0 22 Oct 2020
AssembleNet++: Assembling Modality Representations via Attention Connections Michael S. Ryoo A. Piergiovanni Juhana Kangaspunta A. Angelova 15 44 0 18 Aug 2020
Automatic Operating Room Surgical Activity Recognition for Robot-Assisted Surgery Aidean Sharghi Helene Haugerud Daniel Oh Omid Mohareri 29 44 0 29 Jun 2020
A Comprehensive Survey of Neural Architecture Search: Challenges and Solutions Pengzhen Ren Yun Xiao Xiaojun Chang Po-Yao (Bernie) Huang Zhihui Li Xiaojiang Chen Xin Wang AI4CE 48 653 0 01 Jun 2020
How to Train Your Super-Net: An Analysis of Training Heuristics in Weight-Sharing NAS Kaicheng Yu René Ranftl Mathieu Salzmann 27 34 0 09 Mar 2020
AutoML: A Survey of the State-of-the-Art Xin He Kaiyong Zhao Xiangxiang Chu 20 1,420 0 02 Aug 2019
Neural Architecture Search with Reinforcement Learning Barret Zoph Quoc V. Le 271 5,327 0 05 Nov 2016