BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation
Knowledge

BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge

20 August 2023

Zi Huang

Papers citing "BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge"

10 / 10 papers shown

Title
Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization Ling Xing Hongyu Qu Rui Yan Xiangbo Shu Jinhui Tang 57 2 0 12 Sep 2024
EmotionGesture: Audio-Driven Diverse Emotional Co-Speech 3D Gesture Generation Xingqun Qi Chen Liu Lincheng Li Jie Hou Haoran Xin Xin Yu SLR 59 29 0 30 May 2023
A Closer Look at Weakly-Supervised Audio-Visual Source Localization Shentong Mo Pedro Morgado 104 64 0 30 Aug 2022
Audio-Visual Segmentation Jinxing Zhou Jianyuan Wang Jing Zhang Weixuan Sun Jing Zhang Stan Birchfield Dan Guo Lingpeng Kong Meng Wang Yiran Zhong VOS 49 111 0 11 Jul 2022
Self-Supervised Predictive Learning: A Negative-Free Method for Sound Source Localization in Visual Scenes Zengjie Song Yuxi Wang Junsong Fan Tieniu Tan Zhaoxiang Zhang SSL 36 43 0 25 Mar 2022
Masked-attention Mask Transformer for Universal Image Segmentation Bowen Cheng Ishan Misra Alex Schwing Alexander Kirillov Rohit Girdhar ISeg 162 2,315 0 02 Dec 2021
Localizing Visual Sounds the Hard Way Honglie Chen Weidi Xie Triantafyllos Afouras Arsha Nagrani Andrea Vedaldi Andrew Zisserman ObjD 27 185 0 06 Apr 2021
Positive Sample Propagation along the Audio-Visual Event Line Jinxing Zhou Liang Zheng Yiran Zhong Shijie Hao Meng Wang 36 100 0 01 Apr 2021
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 402 3,660 0 24 Feb 2021
ImageNet Large Scale Visual Recognition Challenge Olga Russakovsky Jia Deng Hao Su J. Krause S. Satheesh ... A. Karpathy A. Khosla Michael S. Bernstein Alexander C. Berg Li Fei-Fei VLM ObjD 843 39,383 0 01 Sep 2014