Multi-scale 2D Temporal Map Diffusion Models for Natural Language Video
Localization

Multi-scale 2D Temporal Map Diffusion Models for Natural Language Video Localization

16 January 2024

Ziwei Liu

Papers citing "Multi-scale 2D Temporal Map Diffusion Models for Natural Language Video Localization"

15 / 15 papers shown

Title
DiffusionDet: Diffusion Model for Object Detection Shoufa Chen Pei Sun Yibing Song Ping Luo 81 450 0 17 Nov 2022
MotionDiffuse: Text-Driven Human Motion Generation with Diffusion Model Mingyuan Zhang Zhongang Cai Liang Pan Fangzhou Hong Xinying Guo Lei Yang Ziwei Liu DiffM VGen 75 558 0 31 Aug 2022
Latent Diffusion Energy-Based Model for Interpretable Text Modeling Peiyu Yu Sirui Xie Xiaojian Ma Baoxiong Jia Bo Pang Ruigi Gao Yixin Zhu Song-Chun Zhu Ying Nian Wu DiffM 57 82 0 13 Jun 2022
Label-Efficient Semantic Segmentation with Diffusion Models Dmitry Baranchuk Ivan Rubachev A. Voynov Valentin Khrulkov Artem Babenko DiffM VLM 231 526 0 06 Dec 2021
SegDiff: Image Segmentation with Diffusion Probabilistic Models Tomer Amit Tal Shaharbany Eliya Nachmani Lior Wolf DiffM 52 299 0 01 Dec 2021
Natural Language Video Localization with Learnable Moment Proposals Shaoning Xiao Long Chen Jian Shao Yueting Zhuang Jun Xiao 34 43 0 22 Sep 2021
Interventional Video Grounding with Dual Contrastive Learning Guoshun Nan Rui Qiao Yao Xiao Jun Liu Sicong Leng H. Zhang Wei Lu 60 145 0 21 Jun 2021
Multi-Scale 2D Temporal Adjacent Networks for Moment Localization with Natural Language Songyang Zhang Houwen Peng Jianlong Fu Yijuan Lu Jiebo Luo 44 51 0 04 Dec 2020
Span-based Localizing Network for Natural Language Video Localization Hao Zhang Aixin Sun Wei Jing Qiufeng Wang 68 313 0 29 Apr 2020
TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval Jie Lei Licheng Yu Tamara L. Berg Joey Tianyi Zhou 172 279 0 24 Jan 2020
Learning 2D Temporal Adjacent Networks for Moment Localization with Natural Language Songyang Zhang Houwen Peng Jianlong Fu Jiebo Luo 37 465 0 08 Dec 2019
Semantic Conditioned Dynamic Modulation for Temporal Sentence Grounding in Videos Yitian Yuan Lin Ma Jingwen Wang Wei Liu Wenwu Zhu 61 243 0 31 Oct 2019
Localizing Moments in Video with Natural Language Lisa Anne Hendricks Oliver Wang Eli Shechtman Josef Sivic Trevor Darrell Bryan C. Russell 89 940 0 04 Aug 2017
TALL: Temporal Activity Localization via Language Query J. Gao Chen Sun Zhenheng Yang Ram Nevatia 105 813 0 05 May 2017
Hollywood in Homes: Crowdsourcing Data Collection for Activity Understanding Gunnar Sigurdsson Gül Varol Xinyu Wang Ali Farhadi Ivan Laptev Abhinav Gupta VGen 75 1,238 0 06 Apr 2016