v1v2v3 (latest)

The 2017 DAVIS Challenge on Video Object Segmentation

3 April 2017

Luc Van Gool

Papers citing "The 2017 DAVIS Challenge on Video Object Segmentation"

50 / 679 papers shown

Title
Translation-based Video-to-Video Synthesis Pratim Saha Chengcui Zhang DiffM 55 1 0 03 Apr 2024
Video Interpolation with Diffusion Models Siddhant Jain Daniel Watson Eric Tabellion Aleksander Holyñski Ben Poole Janne Kontkanen SupR VGen DiffM 99 41 0 01 Apr 2024
Efficient Video Object Segmentation via Modulated Cross-Attention Memory Abdelrahman M. Shaker Syed Talal Wasim Martin Danelljan Salman Khan Ming-Hsuan Yang Fahad Shahbaz Khan VOS 65 4 0 26 Mar 2024
Track Everything Everywhere Fast and Robustly Yunzhou Song Jiahui Lei ZiYun Wang Lingjie Liu Kostas Daniilidis 118 6 0 26 Mar 2024
Efficient Image Pre-Training with Siamese Cropped Masked Autoencoders Alexandre Eymaël Renaud Vandeghen A. Cioppa Silvio Giancola Guohao Li Marc Van Droogenbroeck ViT 75 8 0 26 Mar 2024
Towards Online Real-Time Memory-based Video Inpainting Transformers Guillaume Thiry Hao Tang Radu Timofte Luc Van Gool ViT 45 0 0 24 Mar 2024
Spectral Motion Alignment for Video Motion Transfer using Diffusion Models Geon Yeong Park Hyeonho Jeong Sang Wan Lee Jong Chul Ye VGen DiffM 80 12 0 22 Mar 2024
LiFT: A Surprisingly Simple Lightweight Feature Transform for Dense ViT Descriptors Saksham Suri Matthew Walmer Kamal Gupta Abhinav Shrivastava 74 7 0 21 Mar 2024
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model Zheng Zhang Yeyao Ma Enming Zhang Xiang Bai VLM MLLM 127 47 0 21 Mar 2024
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video Narek Tumanyan Assaf Singer Shai Bagon Tali Dekel MQ 100 32 0 21 Mar 2024
Be-Your-Outpainter: Mastering Video Outpainting through Input-Specific Adaptation Fu-Yun Wang Xiaoshi Wu Zhaoyang Huang Xiaoyu Shi Dazhong Shen Guanglu Song Yu Liu Hongsheng Li DiffM 74 14 0 20 Mar 2024
DreamMotion: Space-Time Self-Similar Score Distillation for Zero-Shot Video Editing Hyeonho Jeong Jinho Chang Geon Yeong Park Jong Chul Ye DiffM VGen 100 18 0 18 Mar 2024
Video Object Segmentation with Dynamic Query Modulation Hantao Zhou Runze Hu Xiu Li VOS 81 1 0 18 Mar 2024
OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning Lingyi Hong Shilin Yan Renrui Zhang Wanyun Li Xinyu Zhou ... Kaixun Jiang Yiting Chen Jinglun Li Zhaoyu Chen Wenqiang Zhang VLM 82 51 0 14 Mar 2024
OneVOS: Unifying Video Object Segmentation with All-in-One Transformer Framework Wanyun Li Pinxue Guo Xinyu Zhou Lingyi Hong Yangji He Xiangyu Zheng Wei Zhang Wenqiang Zhang VOS 101 4 0 13 Mar 2024
Action Reimagined: Text-to-Pose Video Editing for Dynamic Human Actions Lan Wang Vishnu Boddeti Sernam Lim VGen DiffM 54 0 0 11 Mar 2024
BlazeBVD: Make Scale-Time Equalization Great Again for Blind Video Deflickering Xin Qiu Congying Han Zicheng Zhang Bonan li Tiande Guo Pingyu Wang Xuecheng Nie 98 0 0 10 Mar 2024
ClickVOS: Click Video Object Segmentation Pinxue Guo Lingyi Hong Xinyu Zhou Shuyong Gao Wanyun Li Jinglun Li Zhaoyu Chen Xiaoqiang Li Wei Zhang Wenqiang Zhang VOS 70 2 0 10 Mar 2024
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation Joseph Cho Fachrina Dewi Puspitasari Sheng Zheng Jingyao Zheng Lik-Hang Lee Tae-Ho Kim Choong Seon Hong Chaoning Zhang EGVM VGen 104 43 0 08 Mar 2024
$$\text{R}^2$-Bench: Benchmarking the Robustness of Referring Perception Models under Perturbations$ $\text{R}^2$ -Bench: Benchmarking the Robustness of Referring Perception Models under Perturbations Xiang Li Kai Qiu Jinglu Wang Xiaohao Xu Rita Singh Kashu Yamazaki Hao Chen Xiaonan Huang Bhiksha Raj VOS 91 2 0 07 Mar 2024
SAM-PD: How Far Can SAM Take Us in Tracking and Segmenting Anything in Videos by Prompt Denoising Tao Zhou Wenhan Luo Qi Ye Zhiguo Shi Jiming Chen VLM 97 3 0 07 Mar 2024
Video Relationship Detection Using Mixture of Experts A. Shaabana Zahra Gharaee Paul Fieguth 69 1 0 06 Mar 2024
Explicit Motion Handling and Interactive Prompting for Video Camouflaged Object Detection Xin Zhang Tao Xiao Gepeng Ji Xuan Wu Keren Fu Qijun Zhao 86 3 0 04 Mar 2024
VideoMAC: Video Masked Autoencoders Meet ConvNets Gensheng Pei Tao Chen XiRuo Jiang Huafeng Liu Zeren Sun Yazhou Yao VGen 108 10 0 29 Feb 2024
Contextualized Diffusion Models for Text-Guided Image and Video Generation Ling Yang Zhilong Zhang Zhaochen Yu Jingwei Liu Minkai Xu Stefano Ermon Tengjiao Wang 68 4 0 26 Feb 2024
Moving Object Proposals with Deep Learned Optical Flow for Video Object Segmentation Ge Shi Zhili Yang 3DPC OCL VOS 21 1 0 14 Feb 2024
Point-VOS: Pointing Up Video Object Segmentation Idil Esen Zulfikar Sabarinath Mahadevan P. Voigtlaender Bastian Leibe VOS 84 2 0 08 Feb 2024
Evaluation in Neural Style Transfer: A Review E. Ioannou Steve Maddock 72 2 0 30 Jan 2024
Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention Quang-Trung Truong Duc Thanh Nguyen Binh-Son Hua Sai-Kit Yeung VOS 55 2 0 25 Jan 2024
ActAnywhere: Subject-Aware Video Background Generation Boxiao Pan Zhan Xu Chun-Hao Paul Huang Krishna Kumar Singh Yang Zhou Leonidas Guibas Jimei Yang VGen DiffM 61 3 0 19 Jan 2024
Training-Free Semantic Video Composition via Pre-trained Diffusion Model Jiaqi Guo Jingkuan Song Sitong Su Lianli Gao Jingkuan Song DiffM 51 4 0 17 Jan 2024
Object-Centric Diffusion for Efficient Video Editing Kumara Kahatapitiya Adil Karjauv Davide Abati Fatih Porikli Yuki M. Asano A. Habibian VGen 92 13 0 11 Jan 2024
Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions David Junhao Zhang Dongxu Li Hung Le Mike Zheng Shou Caiming Xiong Doyen Sahoo VGen 81 25 0 03 Jan 2024
Refining Pre-Trained Motion Models Xinglong Sun Adam W. Harley Leonidas Guibas 69 11 0 01 Jan 2024
FlowVid: Taming Imperfect Optical Flows for Consistent Video-to-Video Synthesis Feng Liang Bichen Wu Jialiang Wang Licheng Yu Kunpeng Li ... Ishan Misra Jia-Bin Huang Peizhao Zhang Peter Vajda Diana Marculescu VGen DiffM 67 35 0 29 Dec 2023
Tracking with Human-Intent Reasoning Jiawen Zhu Zhi-Qi Cheng Jun-Yan He Chenyang Li Bin Luo Huchuan Lu Yifeng Geng Xuansong Xie LRM VOS 85 11 0 29 Dec 2023
Geometric-Aware Low-Light Image and Video Enhancement via Depth Guidance Yingqi Lin Xiaogang Xu Yan Han Xiaogang Xu Zhe Liu 73 0 0 26 Dec 2023
UniRef++: Segment Every Reference Object in Spatial and Temporal Spaces Jiannan Wu Yi Jiang Bin Yan Huchuan Lu Zehuan Yuan Ping Luo VOS 106 18 0 25 Dec 2023
No More Shortcuts: Realizing the Potential of Temporal Self-Supervision I. Dave Simon Jenni Mubarak Shah 62 10 0 20 Dec 2023
Fairy: Fast Parallelized Instruction-Guided Video-to-Video Synthesis Bichen Wu Ching-Yao Chuang Xiaoyan Wang Yichen Jia K. Krishnakumar Tong Xiao Feng Liang Licheng Yu Peter Vajda DiffM VGen 55 24 0 20 Dec 2023
RealCraft: Attention Control as A Tool for Zero-Shot Consistent Video Editing Shutong Jin Ruiyu Wang Florian T. Pokorny DiffM VGen 212 1 0 19 Dec 2023
MaskINT: Video Editing via Interpolative Non-autoregressive Masked Transformers Haoyu Ma Shahin Mahdizadehaghdam Bichen Wu Zhipeng Fan Yuchao Gu Wenliang Zhao Lior Shapira Xiaohui Xie DiffM VGen 66 4 0 19 Dec 2023
Appearance-based Refinement for Object-Centric Motion Segmentation Junyu Xie Weidi Xie Andrew Zisserman VOS 99 3 0 18 Dec 2023
Hierarchical Graph Pattern Understanding for Zero-Shot VOS Gensheng Pei Fumin Shen Yazhou Yao Tao Chen Xian-Sheng Hua Jikang Cheng VOS 71 3 0 15 Dec 2023
DriveTrack: A Benchmark for Long-Range Point Tracking in Real-World Videos Arjun Balasingam Joseph Chandler Chenning Li Zhoutong Zhang Hari Balakrishnan 62 11 0 15 Dec 2023
TAM-VT: Transformation-Aware Multi-scale Video Transformer for Segmentation and Tracking Raghav Goyal Wan-Cyuan Fan Mennatullah Siam Leonid Sigal VOS 82 3 0 13 Dec 2023
Counterfactual World Modeling for Physical Dynamics Understanding Rahul Venkatesh Honglin Chen Kevin T. Feigelis Daniel M. Bear Khaled Jedoui ... Wanhee Lee Sherry Liu Kevin A. Smith Judith E. Fan Daniel L. K. Yamins VGen 85 2 0 11 Dec 2023
Neutral Editing Framework for Diffusion-based Video Editing Sunjae Yoon Gwanhyeong Koo Jiajing Hong Changdong Yoo VGen DiffM 44 1 0 10 Dec 2023
A Video is Worth 256 Bases: Spatial-Temporal Expectation-Maximization Inversion for Zero-Shot Video Editing Maomao Li Yu Li Tianyu Yang Yunfei Liu Dongxu Yue Zhihui Lin Dong Xu VGen 36 9 0 10 Dec 2023
RepViT-SAM: Towards Real-Time Segmenting Anything Ao Wang Hui Chen Zijia Lin Jungong Han Guiguang Ding VLM 76 20 0 10 Dec 2023