Towards Visual-Prompt Temporal Answering Grounding in Medical
Instructional Video

Towards Visual-Prompt Temporal Answering Grounding in Medical Instructional Video

13 March 2022

Papers citing "Towards Visual-Prompt Temporal Answering Grounding in Medical Instructional Video"

17 / 17 papers shown

Title
Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions Chang Zong Bin Li Shoujun Zhou Jian Wan Lei Zhang 135 0 0 22 Apr 2025
MSA-UNet3+: Multi-Scale Attention UNet3+ with New Supervised Prototypical Contrastive Loss for Coronary DSA Image Segmentation Rayan Merghani Ahmed Adnan Iltaf Mohamed Elmanna Gang Zhao Hongliang Li Yue Du Bin Li Shoujun Zhou 131 0 0 07 Apr 2025
Neutralizing the Narrative: AI-Powered Debiasing of Online News Articles Chen Wei Kuo Kevin Chu Nouar Aldahoul Hazem Ibrahim Talal Rahwan Yasir Zaki SyDa 54 0 0 04 Apr 2025
SCORE: Story Coherence and Retrieval Enhancement for AI Narratives Qiang Yi Yangfan He J. Wang Xinyuan Song Shiyao Qian ... K. Li Kuan Lu Menghao Huo Jiaqi Chen Tianyu Shi RALM 42 8 0 30 Mar 2025
TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation Yuheng Feng Jianhui Wang Kun Li Sida Li Tianyu Shi Haoyue Han Miao Zhang Xueqian Wang DiffM 149 0 0 22 Mar 2025
VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with LoRA and Atrous Attention Adnan Iltaf Rayan Merghani Ahmed Bin Li Bin Li Shoujun Zhou 50 0 0 25 Feb 2025
Visual Answer Localization with Cross-modal Mutual Knowledge Transfer Yixuan Weng Bin Li 24 6 0 26 Oct 2022
A Dataset for Medical Instructional Video Classification and Question Answering D. Gupta Kush Attal Dina Demner-Fushman 42 31 0 30 Jan 2022
Temporal Sentence Grounding in Videos: A Survey and Future Directions Hao Zhang Aixin Sun Wei Jing Qiufeng Wang 3DGS 36 38 0 20 Jan 2022
CPT: Colorful Prompt Tuning for Pre-trained Vision-Language Models Yuan Yao Ao Zhang Zhengyan Zhang Zhiyuan Liu Tat-Seng Chua Maosong Sun MLLM VPVLM VLM 205 221 0 24 Sep 2021
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 330 2,267 0 02 Sep 2021
Natural Language Video Localization: A Revisit in Span-based Question Answering Framework Hao Zhang Aixin Sun Wei Jing Liangli Zhen Qiufeng Wang Rick Siow Mong Goh 113 84 0 26 Feb 2021
End-to-end Audio-visual Speech Recognition with Conformers Pingchuan Ma Stavros Petridis M. Pantic 84 225 0 12 Feb 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir F. Khan M. Shah ViT 227 2,430 0 04 Jan 2021
Pre-trained Models for Natural Language Processing: A Survey Xipeng Qiu Tianxiang Sun Yige Xu Yunfan Shao Ning Dai Xuanjing Huang LM&MA VLM 243 1,450 0 18 Mar 2020
Convolutional Neural Networks for Sentence Classification Yoon Kim AILaw VLM 255 13,364 0 25 Aug 2014
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 242 31,257 0 16 Jan 2013