Stochastic Backpropagation: A Memory Efficient Strategy for Training Video Models

31 March 2022

Papers citing "Stochastic Backpropagation: A Memory Efficient Strategy for Training Video Models"

20 / 20 papers shown

Title
Beyond the Horizon: Decoupling UAVs Multi-View Action Recognition via Partial Order Transfer Wenxuan Liu Xian Zhong Zhuo Zhou Songlin Yang Chia-Wen Lin Alex Chichung Kot 32 0 0 29 Apr 2025
SlowFast-LLaVA-1.5: A Family of Token-Efficient Video Large Language Models for Long-Form Video Understanding Mingze Xu Mingfei Gao Shiyu Li Jiasen Lu Zhe Gan Zhengfeng Lai Meng Cao Kai Kang Yuqing Yang Afshin Dehghan 59 2 0 24 Mar 2025
SnAG: Scalable and Accurate Video Grounding Fangzhou Mu Sicheng Mo Yin Li 42 8 0 02 Apr 2024
LoSA: Long-Short-range Adapter for Scaling End-to-End Temporal Action Localization Akshita Gupta Gaurav Mittal Ahmed Magooda Ye Yu Graham W. Taylor Mei Chen 51 2 0 01 Apr 2024
End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames Shuming Liu Chen-Da Liu-Zhang Chen Zhao Guohao Li 33 25 0 28 Nov 2023
Training a Large Video Model on a Single Machine in a Day Yue Zhao Philipp Krahenbuhl VLM 34 15 0 28 Sep 2023
End-to-End Streaming Video Temporal Action Segmentation with Reinforce Learning Jinrong Zhang Wu Wen Sheng-lan Liu Yunheng Li Qifeng Li Lin Feng 31 0 0 27 Sep 2023
Uncovering the Unseen: Discover Hidden Intentions by Micro-Behavior Graph Reasoning Zhuo Zhou Wenxuan Liu Danni Xu Zheng Wang Jian Zhao 21 6 0 29 Aug 2023
To Adapt or Not to Adapt? Real-Time Adaptation for Semantic Segmentation Marc Botet Colomer Pier Luigi Dovesi Theodoros Panagiotakopoulos J. Carvalho Linus Harenstam-Nielsen Hossein Azizpour Hedvig Kjellström Daniel Cremers Matteo Poggi TTA 30 9 0 27 Jul 2023
E2E-LOAD: End-to-End Long-form Online Action Detection Shuyuan Cao Weihua Luo Bairui Wang Wei Emma Zhang Lin Ma 30 5 0 13 Jun 2023
An In-depth Study of Stochastic Backpropagation J. Fang Ming Xu Hao Chen Bing Shuai Z. Tu Joseph Tighe BDL 32 1 0 30 Sep 2022
MS-RNN: A Flexible Multi-Scale Framework for Spatiotemporal Predictive Learning Zhifeng Ma Hao Zhang Jie Liu HAI AI4CE 25 12 0 07 Jun 2022
ETAD: Training Action Detection End to End on a Laptop Shuming Liu Mengmeng Xu Chen Zhao Xu Zhao Guohao Li 44 6 0 14 May 2022
TALLFormer: Temporal Action Localization with a Long-memory Transformer Feng Cheng Gedas Bertasius ViT 32 91 0 04 Apr 2022
DropIT: Dropping Intermediate Tensors for Memory-Efficient DNN Training Joya Chen Kai Xu Yuhui Wang Yifei Cheng Angela Yao 19 7 0 28 Feb 2022
VidTr: Video Transformer Without Convolutions Yanyi Zhang Xinyu Li Chunhui Liu Bing Shuai Yi Zhu Biagio Brattoli Hao Chen I. Marsic Joseph Tighe ViT 136 193 0 23 Apr 2021
VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari Liangzhe Yuan Rui Qian Wei-Hong Chuang Shih-Fu Chang Huayu Chen Boqing Gong ViT 248 577 0 22 Apr 2021
Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius Heng Wang Lorenzo Torresani ViT 280 1,982 0 09 Feb 2021
Relaxed Transformer Decoders for Direct Action Proposal Generation Jing Tan Jiaqi Tang Limin Wang Gangshan Wu ViT 81 178 0 03 Feb 2021
BSN: Boundary Sensitive Network for Temporal Action Proposal Generation Tianwei Lin Xu Zhao Haisheng Su Chongjing Wang Ming Yang 139 700 0 08 Jun 2018