End-to-End Streaming Video Temporal Action Segmentation with Reinforce Learning

27 September 2023

Papers citing "End-to-End Streaming Video Temporal Action Segmentation with Reinforce Learning"

20 / 20 papers shown

Title
Tuning computer vision models with task rewards André Susano Pinto Alexander Kolesnikov Yuge Shi Lucas Beyer Xiaohua Zhai VLM 52 41 0 16 Feb 2023
Block-Recurrent Transformers DeLesley S. Hutchins Imanol Schlag Yuhuai Wu Ethan Dyer Behnam Neyshabur 78 98 0 11 Mar 2022
Swin Transformer V2: Scaling Up Capacity and Resolution Ze Liu Han Hu Yutong Lin Zhuliang Yao Zhenda Xie ... Yue Cao Zheng Zhang Li Dong Furu Wei B. Guo ViT 209 1,813 0 18 Nov 2021
ASFormer: Transformer for Action Segmentation Fangqiu Yi Hongyu Wen Tingting Jiang ViT 119 176 0 16 Oct 2021
MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer Sachin Mehta Mohammad Rastegari ViT 285 1,271 0 05 Oct 2021
Video Swin Transformer Ze Liu Jia Ning Yue Cao Yixuan Wei Zheng Zhang Stephen Lin Han Hu ViT 100 1,482 0 24 Jun 2021
OadTR: Online Action Detection with Transformers Xiang Wang Shiwei Zhang Zhiwu Qing Yuanjie Shao Zhe Zuo Changxin Gao Nong Sang OffRL ViT 78 115 0 21 Jun 2021
Unsupervised Action Segmentation by Joint Representation Learning and Online Clustering Sateesh Kumar S. Haresh Awais Ahmed Andrey Konin M. Zia Quoc-Huy Tran SSL 63 48 0 27 May 2021
Coarse to Fine Multi-Resolution Temporal Convolutional Network Dipika Singhania R. Rahaman Angela Yao AI4TS 66 55 0 23 May 2021
RoFormer: Enhanced Transformer with Rotary Position Embedding Jianlin Su Yu Lu Shengfeng Pan Ahmed Murtadha Bo Wen Yunfeng Liu 278 2,453 0 20 Apr 2021
Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius Heng Wang Lorenzo Torresani ViT 367 2,053 0 09 Feb 2021
Global2Local: Efficient Structure Search for Video Action Segmentation Shanghua Gao Qi Han Zhong-Yu Li Pai Peng Liang Wang Ming-Ming Cheng EgoV 110 74 0 04 Jan 2021
Alleviating Over-segmentation Errors by Detecting Action Boundaries Yuchi Ishikawa Seito Kasai Y. Aoki Hirokatsu Kataoka 52 139 0 14 Jul 2020
Something-Else: Compositional Action Recognition with Spatial-Temporal Interaction Networks Joanna Materzynska Tete Xiao Roei Herzig Huijuan Xu Xiaolong Wang Trevor Darrell CoGe 51 176 0 20 Dec 2019
TSM: Temporal Shift Module for Efficient Video Understanding Ji Lin Chuang Gan Song Han 98 1,691 0 20 Nov 2018
MobileNetV2: Inverted Residuals and Linear Bottlenecks Mark Sandler Andrew G. Howard Menglong Zhu A. Zhmoginov Liang-Chieh Chen 181 19,284 0 13 Jan 2018
Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset João Carreira Andrew Zisserman 232 8,019 0 22 May 2017
Temporal Convolutional Networks for Action Segmentation and Detection Colin S. Lea Michael D. Flynn René Vidal A. Reiter Gregory Hager 95 1,492 0 16 Nov 2016
End-to-end Learning of Action Detection from Frame Glimpses in Videos Serena Yeung Olga Russakovsky Greg Mori Li Fei-Fei EgoV 106 608 0 22 Nov 2015
Playing Atari with Deep Reinforcement Learning Volodymyr Mnih Koray Kavukcuoglu David Silver Alex Graves Ioannis Antonoglou Daan Wierstra Martin Riedmiller 127 12,231 0 19 Dec 2013