Masked Diffusion with Task-awareness for Procedure Planning in
Instructional Videos

Masked Diffusion with Task-awareness for Procedure Planning in Instructional Videos

14 September 2023

Papers citing "Masked Diffusion with Task-awareness for Procedure Planning in Instructional Videos"

19 / 19 papers shown

Title
A Survey on Diffusion Models for Anomaly Detection Qingbin Liu Zhenchao Ma Zepu Wang Yang Liu Zehua Wang Peng Sun Liang Song Bo Hu Azzedine Boukerche Victor C.M. Leung DiffM MedIm 77 5 0 20 Jan 2025
Fast Training of Diffusion Models with Masked Transformers Hongkai Zheng Weili Nie Arash Vahdat Anima Anandkumar DiffM 82 73 0 15 Jun 2023
Procedure-Aware Pretraining for Instructional Video Understanding Honglu Zhou Roberto Martín-Martín Mubbasir Kapadia Silvio Savarese Juan Carlos Niebles 75 40 0 31 Mar 2023
PDPP: Projected Diffusion for Procedure Planning in Instructional Videos Hanlin Wang Yilu Wu Sheng Guo Limin Wang VGen DiffM 143 31 0 26 Mar 2023
Action Dynamics Task Graphs for Learning Plannable Representations of Procedural Tasks Weichao Mao Ruta Desai Michael L. Iuzzolino Nitin Kamra 51 5 0 11 Jan 2023
Pure Transformers are Powerful Graph Learners Jinwoo Kim Tien Dat Nguyen Seonwoo Min Sungjun Cho Moontae Lee Honglak Lee Seunghoon Hong 86 200 0 06 Jul 2022
Recipe for a General, Powerful, Scalable Graph Transformer Ladislav Rampášek Mikhail Galkin Vijay Prakash Dwivedi Anh Tuan Luu Guy Wolf Dominique Beaini 118 565 0 25 May 2022
P3IV: Probabilistic Procedure Planning from Instructional Videos with Weak Supervision Henghui Zhao Isma Hadji Nikita Dvornik Konstantinos G. Derpanis Richard P. Wildes Allan D. Jepson 75 46 0 04 May 2022
Learning To Recognize Procedural Activities with Distant Supervision Xudong Lin Fabio Petroni Gedas Bertasius Marcus Rohrbach Shih-Fu Chang Lorenzo Torresani 79 87 0 26 Jan 2022
Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman Andrew Westbury Eugene Byrne Zachary Chavis Antonino Furnari ... Mike Zheng Shou Antonio Torralba Lorenzo Torresani Mingfei Yan Jitendra Malik EgoV 393 1,092 0 13 Oct 2021
VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding Hu Xu Gargi Ghosh Po-Yao (Bernie) Huang Dmytro Okhonko Armen Aghajanyan Florian Metze Luke Zettlemoyer Florian Metze Luke Zettlemoyer Christoph Feichtenhofer CLIP VLM 309 578 0 28 Sep 2021
PlaTe: Visually-Grounded Planning with Transformers in Procedural Tasks Jiankai Sun De-An Huang Bo Lu Yunhui Liu Bolei Zhou Animesh Garg 44 55 0 10 Sep 2021
Rescaling Egocentric Vision Dima Damen Hazel Doughty G. Farinella Antonino Furnari Evangelos Kazakos ... Davide Moltisanti Jonathan Munro Toby Perrett Will Price Michael Wray EgoV 72 458 0 23 Jun 2020
DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter Victor Sanh Lysandre Debut Julien Chaumond Thomas Wolf 232 7,504 0 02 Oct 2019
Procedure Planning in Instructional Videos C. Chang De-An Huang Danfei Xu Ehsan Adeli Li Fei-Fei Juan Carlos Niebles 69 103 0 02 Jul 2019
HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips Antoine Miech Dimitri Zhukov Jean-Baptiste Alayrac Makarand Tapaswi Ivan Laptev Josef Sivic VGen 110 1,200 0 07 Jun 2019
Cross-task weakly supervised learning from instructional videos Dimitri Zhukov Jean-Baptiste Alayrac R. G. Cinbis David Fouhey Ivan Laptev Josef Sivic SSL 115 249 0 19 Mar 2019
Learning Plannable Representations with Causal InfoGAN Thanard Kurutach Aviv Tamar Ge Yang Stuart J. Russell Pieter Abbeel GAN DRL 68 180 0 24 Jul 2018
Unsupervised Learning from Narrated Instruction Videos Jean-Baptiste Alayrac Piotr Bojanowski Nishant Agrawal Josef Sivic Ivan Laptev Simon Lacoste-Julien SSL 83 289 0 30 Jun 2015