Compact Trilinear Interaction for Visual Question Answering

26 September 2019

Papers citing "Compact Trilinear Interaction for Visual Question Answering"

29 / 29 papers shown

Title
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering Nghia Hieu Nguyen Tho Thanh Quan Ngan Luu-Thuy Nguyen 31 0 0 18 Oct 2024
Segment Any Events via Weighted Adaptation of Pivotal Tokens Zhiwen Chen Zhiyu Zhu Yifan Zhang Junhui Hou Guangming Shi Jinjian Wu 31 6 0 24 Dec 2023
Categories of Response-Based, Feature-Based, and Relation-Based Knowledge Distillation Chuanguang Yang Xinqiang Yu Zhulin An Yongjun Xu VLM OffRL 86 22 0 19 Jun 2023
VQA with Cascade of Self- and Co-Attention Blocks Aakansha Mishra Ashish Anand Prithwijit Guha 33 0 0 28 Feb 2023
Audio Representation Learning by Distilling Video as Privileged Information Amirhossein Hajavi Ali Etemad 21 4 0 06 Feb 2023
Tensor Networks Meet Neural Networks: A Survey and Future Perspectives Maolin Wang Y. Pan Zenglin Xu Xiangli Yang Guangxi Li A. Cichocki Andrzej Cichocki 53 19 0 22 Jan 2023
Knowledge-enhanced Iterative Instruction Generation and Reasoning for Knowledge Base Question Answering Haowei Du Quzhe Huang Chen Zhang Dongyan Zhao 31 3 0 07 Sep 2022
Interactive Question Answering Systems: Literature Review Giovanni Maria Biancofiore Yashar Deldjoo Tommaso Di Noia E. Sciascio Fedelucio Narducci 34 13 0 04 Sep 2022
From Shallow to Deep: Compositional Reasoning over Graphs for Visual Question Answering Zihao Zhu NAI ReLM GNN 30 3 0 25 Jun 2022
PEVL: Position-enhanced Pre-training and Prompt Tuning for Vision-language Models Yuan Yao Qi-An Chen Ao Zhang Wei Ji Zhiyuan Liu Tat-Seng Chua Maosong Sun VLM MLLM 26 38 0 23 May 2022
Attention in Reasoning: Dataset, Analysis, and Modeling Shi Chen Ming Jiang Jinhui Yang Qi Zhao LRM 33 3 0 20 Apr 2022
Cross-modal Contrastive Distillation for Instructional Activity Anticipation Zhengyuan Yang Jingen Liu Jing-ling Huang Xiaodong He Tao Mei Chenliang Xu Jiebo Luo 31 6 0 18 Jan 2022
Coarse-to-Fine Reasoning for Visual Question Answering Binh X. Nguyen Tuong Khanh Long Do Huy Tran Erman Tjiputra Quang-Dieu Tran A. Nguyen NAI 70 36 0 06 Oct 2021
Towards Developing a Multilingual and Code-Mixed Visual Question Answering System by Knowledge Distillation H. Khan D. Gupta Asif Ekbal 27 14 0 10 Sep 2021
Residual Tensor Train: A Quantum-inspired Approach for Learning Multiple Multilinear Correlations Yiwei Chen Y. Pan D. Dong 21 3 0 19 Aug 2021
MOI-Mixer: Improving MLP-Mixer with Multi Order Interactions in Sequential Recommendation Hojoon Lee Dongyoon Hwang Sunghwan Hong Changyeon Kim Seungryong Kim Jaegul Choo 27 10 0 17 Aug 2021
Unsupervised Cross-Modal Distillation for Thermal Infrared Tracking Jingxian Sun Lichao Zhang Yufei Zha Abel Gonzalez-Garcia Peng Zhang Wei Huang Yanning Zhang ViT 14 27 0 31 Jul 2021
VidLanKD: Improving Language Understanding via Video-Distilled Knowledge Transfer Zineng Tang Jaemin Cho Hao Tan Joey Tianyi Zhou VLM 30 29 0 06 Jul 2021
Multiple Meta-model Quantifying for Medical Visual Question Answering Tuong Khanh Long Do Binh X. Nguyen Erman Tjiputra Minh-Ngoc Tran Quang-Dieu Tran A. Nguyen 38 98 0 19 May 2021
MRI-based Alzheimer's disease prediction via distilling the knowledge in multi-modal data Hao Guan Chaoyue Wang Dacheng Tao 16 30 0 08 Apr 2021
There is More than Meets the Eye: Self-Supervised Multi-Object Detection and Tracking with Sound by Distilling Multimodal Knowledge Francisco Rivera Valverde Juana Valeria Hurtado Abhinav Valada 26 72 0 01 Mar 2021
Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signals Gaole He Yunshi Lan Jing Jiang Wayne Xin Zhao Ji-Rong Wen 120 187 0 11 Jan 2021
Multimodal Research in Vision and Language: A Review of Current and Emerging Trends Shagun Uppal Sarthak Bhagat Devamanyu Hazarika Navonil Majumdar Soujanya Poria Roger Zimmermann Amir Zadeh 23 6 0 19 Oct 2020
AiR: Attention with Reasoning Capability Shi Chen Ming Jiang Jinhui Yang Qi Zhao LRM 13 36 0 28 Jul 2020
Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation Liwei Wang Jing-ling Huang Yin Li Kun Xu Zhengyuan Yang Dong Yu ObjD 19 80 0 03 Jul 2020
Knowledge Distillation: A Survey Jianping Gou B. Yu Stephen J. Maybank Dacheng Tao VLM 19 2,843 0 09 Jun 2020
Stroke Constrained Attention Network for Online Handwritten Mathematical Expression Recognition Jiaming Wang Jun Du Jianshu Zhang 27 24 0 20 Feb 2020
VQA with no questions-answers training B. Vatashsky S. Ullman 41 12 0 20 Nov 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 158 1,464 0 06 Jun 2016