Yin and Yang: Balancing and Answering Binary Visual Questions

16 November 2015

Devi Parikh

Papers citing "Yin and Yang: Balancing and Answering Binary Visual Questions"

50 / 203 papers shown

Title
Learning from others' mistakes: Avoiding dataset biases without modeling them Victor Sanh Thomas Wolf Yonatan Belinkov Alexander M. Rush 25 115 0 02 Dec 2020
Transformation Driven Visual Reasoning Xin Hong Yanyan Lan Liang Pang Jiafeng Guo Xueqi Cheng LRM 29 21 0 26 Nov 2020
Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles Christopher Clark Mark Yatskar Luke Zettlemoyer 26 61 0 07 Nov 2020
Loss re-scaling VQA: Revisiting the LanguagePrior Problem from a Class-imbalance View Yangyang Guo Liqiang Nie Zhiyong Cheng Q. Tian Min Zhang 19 69 0 30 Oct 2020
MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question Answering Aisha Urooj Khan Amir Mazaheri N. Lobo M. Shah 32 56 0 27 Oct 2020
SOrT-ing VQA Models : Contrastive Gradient Learning for Improved Consistency Sameer Dharur Purva Tendulkar Dhruv Batra Devi Parikh Ramprasaath R. Selvaraju 21 2 0 20 Oct 2020
New Ideas and Trends in Deep Multimodal Content Understanding: A Review Wei Chen Weiping Wang Li Liu M. Lew VLM 118 31 0 16 Oct 2020
What is More Likely to Happen Next? Video-and-Language Future Event Prediction Jie Lei Licheng Yu Tamara L. Berg Joey Tianyi Zhou 33 72 0 15 Oct 2020
Contrast and Classify: Training Robust VQA Models Yash Kant A. Moudgil Dhruv Batra Devi Parikh Harsh Agrawal 21 5 0 13 Oct 2020
IQ-VQA: Intelligent Visual Question Answering Vatsal Goel Mohit Chandak A. Anand Prithwijit Guha 28 5 0 08 Jul 2020
Visual Question Answering as a Multi-Task Problem A. E. Pollard J. Shapiro 15 7 0 03 Jul 2020
A Study of Compositional Generalization in Neural Models Tim Klinger D. Adjodah Vincent Marois Joshua Joseph Matthew D Riemer Alex Pentland Murray Campbell CoGe NAI 30 12 0 16 Jun 2020
Counterfactual VQA: A Cause-Effect Look at Language Bias Yulei Niu Kaihua Tang Hanwang Zhang Zhiwu Lu Xiansheng Hua Ji-Rong Wen CML 56 395 0 08 Jun 2020
CompGuessWhat?!: A Multi-task Evaluation Framework for Grounded Language Learning Alessandro Suglia Ioannis Konstas Andrea Vanzo E. Bastianelli Desmond Elliott Stella Frank Oliver Lemon 37 16 0 03 Jun 2020
Look at the First Sentence: Position Bias in Question Answering Miyoung Ko Jinhyuk Lee Hyunjae Kim Gangwoo Kim Jaewoo Kang FaML OOD 27 100 0 30 Apr 2020
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision Damien Teney Ehsan Abbasnejad Anton Van Den Hengel OOD SSL CML 34 118 0 20 Apr 2020
Multiple Visual-Semantic Embedding for Video Retrieval from Query Sentence Huy Manh Nguyen Tomo Miyazaki Yoshihiro Sugaya S. Omachi 45 1 0 16 Apr 2020
Avoiding the Hypothesis-Only Bias in Natural Language Inference via Ensemble Adversarial Training Joe Stacey Pasquale Minervini Haim Dubossarsky Sebastian Riedel Tim Rocktaschel AI4CE 28 8 0 16 Apr 2020
Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text Difei Gao Ke Li Ruiping Wang Shiguang Shan Xilin Chen 16 111 0 31 Mar 2020
$P $\approx$ NP, at least in Visual Question Answering$ P $\approx$ NP, at least in Visual Question Answering Shailza Jolly Sebastián M. Palacio Joachim Folz Federico Raue Jörn Hees Andreas Dengel 19 0 0 26 Mar 2020
Counterfactual Samples Synthesizing for Robust Visual Question Answering Long Chen Xin Yan Jun Xiao Hanwang Zhang Shiliang Pu Yueting Zhuang OOD AAML 154 290 0 14 Mar 2020
Cops-Ref: A new Dataset and Task on Compositional Referring Expression Comprehension Zhenfang Chen Peng Wang Lin Ma Kwan-Yee K. Wong Qi Wu ObjD 34 68 0 01 Mar 2020
Unshuffling Data for Improved Generalization Damien Teney Ehsan Abbasnejad Anton Van Den Hengel OOD 31 76 0 27 Feb 2020
VQA-LOL: Visual Question Answering under the Lens of Logic Tejas Gokhale Pratyay Banerjee Chitta Baral Yezhou Yang CoGe 28 73 0 19 Feb 2020
SQuINTing at VQA Models: Introspecting VQA Models with Sub-Questions Ramprasaath R. Selvaraju Purva Tendulkar Devi Parikh Eric Horvitz Marco Tulio Ribeiro Besmira Nushi Ece Kamar LRM 8 14 0 20 Jan 2020
Towards Causal VQA: Revealing and Reducing Spurious Correlations by Invariant and Covariant Semantic Editing Vedika Agarwal Rakshith Shetty Mario Fritz CML AAML 32 155 0 16 Dec 2019
Exposing and Correcting the Gender Bias in Image Captioning Datasets and Models Shruti Bhargava David A. Forsyth FaML 19 49 0 02 Dec 2019
Assessing the Robustness of Visual Question Answering Models Jia-Hong Huang Modar Alfadly Guohao Li M. Worring AAML OOD 23 23 0 30 Nov 2019
TAB-VCR: Tags and Attributes based Visual Commonsense Reasoning Baselines Jingxiang Lin Unnat Jain Alex Schwing LRM ReLM 37 9 0 31 Oct 2019
Assisting human experts in the interpretation of their visual process: A case study on assessing copper surface adhesive potency T. Hascoet Xuejiao Deng Daniela Mihai Mari Sugiyama Yuji Adachi Sachiko Nakamura Jonathon S. Hare Tomoko Hayashi T. Takiguchi 9 1 0 24 Oct 2019
Unified Vision-Language Pre-Training for Image Captioning and VQA Luowei Zhou Hamid Palangi Lei Zhang Houdong Hu Jason J. Corso Jianfeng Gao MLLM VLM 252 927 0 24 Sep 2019
Don't Take the Easy Way Out: Ensemble Based Methods for Avoiding Known Dataset Biases Christopher Clark Mark Yatskar Luke Zettlemoyer OOD 34 460 0 09 Sep 2019
Language Features Matter: Effective Language Representations for Vision-Language Tasks Andrea Burns Reuben Tan Kate Saenko Stan Sclaroff Bryan A. Plummer VLM 27 27 0 17 Aug 2019
Fusion of Detected Objects in Text for Visual Question Answering Chris Alberti Jeffrey Ling Michael Collins David Reitter 17 173 0 14 Aug 2019
Multi-modality Latent Interaction Network for Visual Question Answering Peng Gao Haoxuan You Zhanpeng Zhang Xiaogang Wang Hongsheng Li 25 82 0 10 Aug 2019
SpatialSense: An Adversarially Crowdsourced Benchmark for Spatial Relation Recognition Kaiyu Yang Olga Russakovsky Jia Deng 3DPC 26 60 0 07 Aug 2019
Logic could be learned from images Q. Guo Y. Qian Xinyan Liang Yanhong She Deyu Li Jiye Liang NAI 22 4 0 06 Aug 2019
Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and Methods Aditya Mogadala M. Kalimuthu Dietrich Klakow VLM 25 132 0 22 Jul 2019
Don't Take the Premise for Granted: Mitigating Artifacts in Natural Language Inference Yonatan Belinkov Adam Poliak Stuart M. Shieber Benjamin Van Durme Alexander M. Rush 27 94 0 09 Jul 2019
Investigating Biases in Textual Entailment Datasets Shawn Tan Songlin Yang Chin-Wei Huang Aaron Courville 27 8 0 23 Jun 2019
Adversarial Regularization for Visual Question Answering: Strengths, Shortcomings, and Side Effects Gabriel Grand Yonatan Belinkov 21 68 0 20 Jun 2019
Scene Text Visual Question Answering Ali Furkan Biten Rubèn Pérez Tito Andrés Mafla Lluís Gómez Marçal Rusiñol Ernest Valveny C. V. Jawahar Dimosthenis Karatzas 39 343 0 31 May 2019
What Makes Training Multi-Modal Classification Networks Hard? Weiyao Wang Du Tran Matt Feiszli 34 443 0 29 May 2019
CGaP: Continuous Growth and Pruning for Efficient Deep Learning Xiaocong Du Zheng Li Yu Cao VLM 23 10 0 27 May 2019
Efficient Network Construction through Structural Plasticity Xiaocong Du Zheng Li Yufei Ma Yu Cao 6 12 0 27 May 2019
Quantifying and Alleviating the Language Prior Problem in Visual Question Answering Yangyang Guo Zhiyong Cheng Liqiang Nie Yebin Liu Yinglong Wang Mohan Kankanhalli 22 36 0 13 May 2019
Challenges and Prospects in Vision and Language Research Kushal Kafle Robik Shrestha Christopher Kanan 24 41 0 19 Apr 2019
Actively Seeking and Learning from Live Data Damien Teney Anton Van Den Hengel OOD 32 21 0 05 Apr 2019
Optimising the Input Image to Improve Visual Relationship Detection Noel Mizzi A. Muscat 8 2 0 26 Mar 2019
From Visual to Acoustic Question Answering Jerome Abdelnour G. Salvi Jean Rouat 24 3 0 28 Feb 2019