Efficient Large-Scale Multi-Modal Classification

6 February 2018

D. Kiela

Papers citing "Efficient Large-Scale Multi-Modal Classification"

24 / 24 papers shown

Title
DynCIM: Dynamic Curriculum for Imbalanced Multimodal Learning Chengxuan Qian Kai Han J. Wang Zhenlong Yuan Rui Qian Chongwen Lyu Jun Chen 54 1 0 09 Mar 2025
Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding Aaron Lohner Francesco Compagno Jonathan M Francis A. Oltramari 57 2 0 10 Jan 2025
CREMA: Generalizable and Efficient Video-Language Reasoning via Multimodal Modular Fusion Shoubin Yu Jaehong Yoon Mohit Bansal 79 4 0 08 Feb 2024
Versatile Diffusion: Text, Images and Variations All in One Diffusion Model Xingqian Xu Zhangyang Wang Eric Zhang Kai Wang Humphrey Shi DiffM 41 183 0 15 Nov 2022
PMR: Prototypical Modal Rebalance for Multimodal Learning Yunfeng Fan Wenchao Xu Yining Qi Junxiao Wang Song Guo 25 62 0 14 Nov 2022
DM $^2$ S $^2$ : Deep Multi-Modal Sequence Sets with Hierarchical Modality Attention Shunsuke Kitada Yuki Iwazaki Riku Togashi Hitoshi Iyatomi 21 1 0 07 Sep 2022
Trusted Multi-View Classification with Dynamic Evidential Fusion Zongbo Han Changqing Zhang Huazhu Fu Qiufeng Wang EDL 28 219 0 25 Apr 2022
Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma Distributions Huan Ma Zongbo Han Changqing Zhang Huazhu Fu Qiufeng Wang Q. Hu EDL UQCV 77 42 0 11 Nov 2021
Audio-Visual Transformer Based Crowd Counting Usman Sajid Xiangyu Chen Hasan Sajid Taejoon Kim Guanghui Wang ViT 43 22 0 04 Sep 2021
A Review on Explainability in Multimodal Deep Neural Nets Gargi Joshi Rahee Walambe K. Kotecha 29 139 0 17 May 2021
AdaMML: Adaptive Multi-Modal Learning for Efficient Video Recognition Yikang Shen Chun-Fu Chen Quanfu Fan Ximeng Sun Kate Saenko A. Oliva Rogerio Feris 33 47 0 11 May 2021
Can audio-visual integration strengthen robustness under multimodal attacks? Yapeng Tian Chenliang Xu AAML 31 37 0 05 Apr 2021
Trusted Multi-View Classification Zongbo Han Changqing Zhang Huazhu Fu Qiufeng Wang EDL 27 165 0 03 Feb 2021
Detecting Online Hate Speech: Approaches Using Weak Supervision and Network Embedding Models Michael Ridenhour A. Bagavathi Elaheh Raisi S. Krishnan 14 10 0 24 Jul 2020
Cross-modal Speaker Verification and Recognition: A Multilingual Perspective M. S. Saeed Shah Nawaz Pietro Morerio Arif Mahmood I. Gallo Muhammad Haroon Yousaf Alessio Del Bue CVBM 26 25 0 28 Apr 2020
Multimodal Categorization of Crisis Events in Social Media Mahdi Abavisani Liwei Wu Shengli Hu Joel R. Tetreault A. Jaimes 29 87 0 10 Apr 2020
Deep Multi-Modal Sets A. Reiter Menglin Jia Pu Yang Ser-Nam Lim BDL 25 4 0 03 Mar 2020
Picture What you Read I. Gallo Shah Nawaz Alessandro Calefati Riccardo La Grassa Nicola Landro DiffM 26 0 0 09 Sep 2019
Supervised Multimodal Bitransformers for Classifying Images and Text Douwe Kiela Suvrat Bhooshan Hamed Firooz Ethan Perez Davide Testuggine 59 241 0 06 Sep 2019
Pedestrian Trajectory Prediction with Structured Memory Hierarchies Tharindu Fernando Simon Denman Sridha Sridharan Clinton Fookes 19 18 0 22 Jul 2018
Deep Multimodal Subspace Clustering Networks Mahdi Abavisani Vishal M. Patel 28 163 0 17 Apr 2018
Audio-Visual Event Localization in Unconstrained Videos Yapeng Tian Jing Shi Bochen Li Zhiyao Duan Chenliang Xu 33 425 0 23 Mar 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 167 1,464 0 06 Jun 2016
Convolutional Neural Networks for Sentence Classification Yoon Kim AILaw VLM 255 13,368 0 25 Aug 2014