Reconstruction Network for Video Captioning

30 March 2018

Papers citing "Reconstruction Network for Video Captioning"

37 / 87 papers shown

Title
Fully Convolutional Networks for Continuous Sign Language Recognition Ka Leong Cheng Zhaoyang Yang Qifeng Chen Yu-Wing Tai SLR 86 148 0 24 Jul 2020
Learning to Discretely Compose Reasoning Module Networks for Video Captioning Ganchao Tan Daqing Liu Meng Wang Zhengjun Zha LRM 86 74 0 17 Jul 2020
Comprehensive Information Integration Modeling Framework for Video Titling Shengyu Zhang Ziqi Tan Jin Yu Zhou Zhao Kun Kuang Tan Jiang Jingren Zhou Hongxia Yang Leilei Gan 107 40 0 24 Jun 2020
Spatio-Temporal Graph for Video Captioning with Knowledge Distillation Boxiao Pan Haoye Cai De-An Huang Kuan-Hui Lee Adrien Gaidon Ehsan Adeli Juan Carlos Niebles 79 236 0 31 Mar 2020
Accurate Temporal Action Proposal Generation with Relation-Aware Pyramid Network Jialin Gao Zhixiang Shi Jiani Li Guanshuo Wang Yufeng Yuan Shiming Ge Xiaoping Zhou 64 76 0 09 Mar 2020
Object Relational Graph with Teacher-Recommended Learning for Video Captioning Ziqi Zhang Yaya Shi Chunfen Yuan Bing Li Peijin Wang Weiming Hu Zhengjun Zha VLM 95 275 0 26 Feb 2020
Meaning guided video captioning Rushi J. Babariya Toru Tamaki 39 3 0 12 Dec 2019
Non-Autoregressive Coarse-to-Fine Video Captioning Bang-ju Yang Yuexian Zou Fenglin Liu Can Zhang 96 11 0 27 Nov 2019
Video Captioning with Text-based Dynamic Attention and Step-by-Step Learning Huanhou Xiao Jinglun Shi 37 25 0 05 Nov 2019
Low-Rank HOCA: Efficient High-Order Cross-Modal Attention for Video Captioning Tao Jin Siyu Huang Yingming Li Zhongfei Zhang 88 20 0 01 Nov 2019
Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion Network Bairui Wang Lin Ma Wei Zhang Wenhao Jiang Jingwen Wang Wei Liu 137 163 0 27 Aug 2019
SF-Net: Structured Feature Network for Continuous Sign Language Recognition Zhaoyang Yang Zhenmei Shi Xiaoyong Shen Yu-Wing Tai SLR 60 64 0 04 Aug 2019
Learning Visual Actions Using Multiple Verb-Only Labels Michael Wray Dima Damen 78 7 0 25 Jul 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 141 136 0 22 Jul 2019
Watch It Twice: Video Captioning with a Refocused Video Encoder Xiangxi Shi Jianfei Cai Shafiq Joty Jiuxiang Gu 70 28 0 21 Jul 2019
Object-aware Aggregation with Bidirectional Temporal Graph for Video Captioning Junchao Zhang Yuxin Peng 91 172 0 11 Jun 2019
Weakly-Supervised Spatio-Temporally Grounding Natural Sentence in Video Zhenfang Chen Lin Ma Wenhan Luo Kwan-Yee K. Wong 98 103 0 06 Jun 2019
Reconstruct and Represent Video Contents for Captioning via Reinforcement Learning Wei Zhang Bairui Wang Lin Ma Wei Liu 116 67 0 03 Jun 2019
Learning to Generate Grounded Visual Captions without Localization Supervision Chih-Yao Ma Yannis Kalantidis Ghassan AlRegib Peter Vajda Marcus Rohrbach Z. Kira SSL 43 10 0 01 Jun 2019
Hallucinating Optical Flow Features for Video Classification Yongyi Tang Lin Ma Lianqiang Zhou 49 19 0 28 May 2019
Memory-Attended Recurrent Network for Video Captioning Wenjie Pei Jiyuan Zhang Xiangrong Wang Lei Ke Xiaoyong Shen Yu-Wing Tai 106 204 0 10 May 2019
Spatio-temporal Video Re-localization by Warp LSTM Yang Feng Lin Ma Wei Liu Jiebo Luo 66 39 0 10 May 2019
Streamlined Dense Video Captioning Jonghwan Mun L. Yang Zhou Ren N. Xu Bohyung Han 94 144 0 08 Apr 2019
Self-supervised Spatio-temporal Representation Learning for Videos by Predicting Motion and Appearance Statistics Jiangliu Wang Jianbo Jiao Linchao Bao Shengfeng He Yunhui Liu Wen Liu SSL 59 207 0 07 Apr 2019
End-to-End Video Captioning Silvio Olivastri Gurkirt Singh Fabio Cuzzolin 63 18 0 04 Apr 2019
Spatio-Temporal Dynamics and Semantic Attribute Enriched Visual Encoding for Video Captioning Nayyer Aafaq Naveed Akhtar Wen Liu Syed Zulqarnain Gilani Ajmal Mian 79 206 0 27 Feb 2019
Hierarchical Photo-Scene Encoder for Album Storytelling Bairui Wang Lin Ma Wei Zhang Wenhao Jiang Feng-Li Zhang 67 28 0 02 Feb 2019
Adversarial Inference for Multi-Sentence Video Description J. S. Park Marcus Rohrbach Trevor Darrell Anna Rohrbach 81 80 0 13 Dec 2018
An Attempt towards Interpretable Audio-Visual Video Captioning Yapeng Tian Chenxiao Guan Justin Goodman Marc Moore Chenliang Xu 91 20 0 07 Dec 2018
Multi-granularity Generator for Temporal Action Proposal Yuan Liu Lin Ma Yifeng Zhang Wen Liu Shih-Fu Chang 101 194 0 28 Nov 2018
Y^2Seq2Seq: Cross-Modal Representation Learning for 3D Shape and Text by Joint Reconstruction and Prediction of View and Word Sequences Simon Denman Mingyang Shang Sabesan Sivapalan Yu-Shen Liu Matthias Zwicker 3DV 75 54 0 07 Nov 2018
Non-local NetVLAD Encoding for Video Classification Yongyi Tang Xing Zhang Jingwen Wang Shaoxiang Chen Lin Ma Yu-Gang Jiang 67 41 0 29 Sep 2018
Video Re-localization Yang Feng Lin Ma Wen Liu Tong Zhang Jiebo Luo 113 72 0 05 Aug 2018
Recurrent Fusion Network for Image Captioning Wenhao Jiang Lin Ma Yu-Gang Jiang Wen Liu Tong Zhang ObjD 88 236 0 26 Jul 2018
Video Captioning with Boundary-aware Hierarchical Language Decoding and Joint Video Prediction Xiangxi Shi Jianfei Cai Jiuxiang Gu Shafiq Joty 50 19 0 08 Jul 2018
Video Description: A Survey of Methods, Datasets and Evaluation Metrics Nayyer Aafaq Ajmal Mian Wen Liu Syed Zulqarnain Gilani Mubarak Shah 135 93 0 01 Jun 2018
Less Is More: Picking Informative Frames for Video Captioning Yangyu Chen Shuhui Wang Wentao Zhang Qingming Huang 85 201 0 05 Mar 2018