Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books

22 June 2015

Antonio Torralba

Sanja Fidler

ArXiv PDF HTML

Papers citing "Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books"

50 / 523 papers shown

Title
DeBERTa: Decoding-enhanced BERT with Disentangled Attention Pengcheng He Xiaodong Liu Jianfeng Gao Weizhu Chen AAML 64 2,622 0 05 Jun 2020
CausaLM: Causal Model Explanation Through Counterfactual Language Models Amir Feder Nadav Oved Uri Shalit Roi Reichart CML LRM 44 157 0 27 May 2020
A Recipe for Creating Multimodal Aligned Datasets for Sequential Tasks Angela S. Lin Sudha Rao Asli Celikyilmaz E. Nouri Chris Brockett Debadeepta Dey Bill Dolan 26 24 0 19 May 2020
Entity-Enriched Neural Models for Clinical Question Answering Bhanu Pratap Singh Rawat W. Weng So Yeon Min Preethi Raghavan Peter Szolovits 18 18 0 13 May 2020
LinCE: A Centralized Benchmark for Linguistic Code-switching Evaluation Gustavo Aguilar Sudipta Kar Thamar Solorio 27 110 0 09 May 2020
BERT-kNN: Adding a kNN Search Component to Pretrained Language Models for Better QA Nora Kassner Hinrich Schütze RALM 19 68 0 02 May 2020
Probing Contextual Language Models for Common Ground with Visual Representations Gabriel Ilharco Rowan Zellers Ali Farhadi Hannaneh Hajishirzi 30 14 0 01 May 2020
Mind Your Inflections! Improving NLP for Non-Standard Englishes with Base-Inflection Encoding Samson Tan Chenyu You L. Varshney Min-Yen Kan 17 34 0 30 Apr 2020
Zero-Shot Learning and its Applications from Autonomous Vehicles to COVID-19 Diagnosis: A Review Mahdi Rezaei Mahsa Shahidi 24 53 0 29 Apr 2020
Sample-Efficient Model-based Actor-Critic for an Interactive Dialogue Task Katya Kudashkina Valliappa Chockalingam Graham W. Taylor Michael Bowling OffRL LLMAG 33 2 0 28 Apr 2020
Residual Energy-Based Models for Text Generation Yuntian Deng A. Bakhtin Myle Ott Arthur Szlam MarcÁurelio Ranzato 22 125 0 22 Apr 2020
Train No Evil: Selective Masking for Task-Guided Pre-Training Yuxian Gu Zhengyan Zhang Xiaozhi Wang Zhiyuan Liu Maosong Sun 32 59 0 21 Apr 2020
StereoSet: Measuring stereotypical bias in pretrained language models Moin Nadeem Anna Bethke Siva Reddy 37 957 0 20 Apr 2020
SongNet: Rigid Formats Controlled Text Generation Piji Li Haisong Zhang Xiaojiang Liu Shuming Shi 27 53 0 17 Apr 2020
Weight Poisoning Attacks on Pre-trained Models Keita Kurita Paul Michel Graham Neubig AAML SILM 33 434 0 14 Apr 2020
Improving Scholarly Knowledge Representation: Evaluating BERT-based Models for Scientific Relation Classification Ming Jiang Jennifer D'Souza Sören Auer J. S. Downie 25 11 0 13 Apr 2020
CLUE: A Chinese Language Understanding Evaluation Benchmark Liang Xu Hai Hu Xuanwei Zhang Lu Li Chenjie Cao ... Cong Yue Xinrui Zhang Zhen-Yi Yang Kyle Richardson Zhenzhong Lan ELM 45 377 0 13 Apr 2020
Longformer: The Long-Document Transformer Iz Beltagy Matthew E. Peters Arman Cohan RALM VLM 28 3,929 0 10 Apr 2020
Information Leakage in Embedding Models Congzheng Song A. Raghunathan MIACV 21 262 0 31 Mar 2020
Speech2Action: Cross-modal Supervision for Action Recognition Arsha Nagrani Chen Sun David A. Ross Rahul Sukthankar Cordelia Schmid Andrew Zisserman 33 54 0 30 Mar 2020
A Survey on Contextual Embeddings Qi Liu Matt J. Kusner Phil Blunsom 225 146 0 16 Mar 2020
TRANS-BLSTM: Transformer with Bidirectional LSTM for Language Understanding Zhiheng Huang Peng Xu Davis Liang Ajay K. Mishra Bing Xiang 10 31 0 16 Mar 2020
Finnish Language Modeling with Deep Transformer Models Abhilash Jain Aku Rouhe Stig-Arne Gronroos M. Kurimo 9 0 0 14 Mar 2020
Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning Zhiyuan Fang Tejas Gokhale Pratyay Banerjee Chitta Baral Yezhou Yang 23 60 0 11 Mar 2020
CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Model Liang Xu Xuanwei Zhang Qianqian Dong SSL 11 70 0 03 Mar 2020
Sequential Neural Networks for Noetic End-to-End Response Selection Qian Chen Wen Wang OffRL 31 7 0 03 Mar 2020
A Question-Centric Model for Visual Question Answering in Medical Imaging Minh H. Vu Tommy Löfstedt T. Nyholm Raphael Sznitman MedIm 19 59 0 02 Mar 2020
AraBERT: Transformer-based Model for Arabic Language Understanding Wissam Antoun Fady Baly Hazem M. Hajj 46 939 0 28 Feb 2020
MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers Wenhui Wang Furu Wei Li Dong Hangbo Bao Nan Yang Ming Zhou VLM 47 1,203 0 25 Feb 2020
Predicting Subjective Features of Questions of QA Websites using BERT Issa Annamoradnejad MohammadAmin Fazli J. Habibi AI4MH 14 15 0 24 Feb 2020
Federated pretraining and fine tuning of BERT using clinical notes from multiple silos Dianbo Liu Timothy A. Miller AI4MH 32 34 0 20 Feb 2020
Low-Rank Bottleneck in Multi-head Attention Models Srinadh Bhojanapalli Chulhee Yun A. S. Rawat Sashank J. Reddi Sanjiv Kumar 24 94 0 17 Feb 2020
ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning Weihao Yu Zihang Jiang Yanfei Dong Jiashi Feng LRM 19 240 0 11 Feb 2020
ImageBERT: Cross-modal Pre-training with Large-scale Weak-supervised Image-Text Data Di Qi Lin Su Jianwei Song Edward Cui Taroon Bharti Arun Sacheti VLM 40 259 0 22 Jan 2020
ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training Weizhen Qi Yu Yan Yeyun Gong Dayiheng Liu Nan Duan Jiusheng Chen Ruofei Zhang Ming Zhou AI4TS 27 446 0 13 Jan 2020
Deep Attentive Ranking Networks for Learning to Order Sentences Pawan Kumar Dhanajit Brahma H. Karnick Piyush Rai 21 45 0 31 Dec 2019
Are Transformers universal approximators of sequence-to-sequence functions? Chulhee Yun Srinadh Bhojanapalli A. S. Rawat Sashank J. Reddi Sanjiv Kumar 11 335 0 20 Dec 2019
Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model Wenhan Xiong Jingfei Du William Yang Wang Veselin Stoyanov SSL KELM 50 201 0 20 Dec 2019
What do you mean, BERT? Assessing BERT as a Distributional Semantics Model Timothee Mickus Denis Paperno Mathieu Constant Kees van Deemter 26 45 0 13 Nov 2019
Compressive Transformers for Long-Range Sequence Modelling Jack W. Rae Anna Potapenko Siddhant M. Jayakumar Timothy Lillicrap RALM VLM KELM 13 621 0 13 Nov 2019
Attending to Entities for Better Text Understanding Pengxiang Cheng K. Erk LRM 19 37 0 11 Nov 2019
Social Bias Frames: Reasoning about Social and Power Implications of Language Maarten Sap Saadia Gabriel Lianhui Qin Dan Jurafsky Noah A. Smith Yejin Choi 33 484 0 10 Nov 2019
Improving Transformer Models by Reordering their Sublayers Ofir Press Noah A. Smith Omer Levy 16 87 0 10 Nov 2019
How Decoding Strategies Affect the Verifiability of Generated Text Luca Massarelli Fabio Petroni Aleksandra Piktus Myle Ott Tim Rocktaschel Vassilis Plachouras Fabrizio Silvestri Sebastian Riedel 23 50 0 09 Nov 2019
Not Enough Data? Deep Learning to the Rescue! Ateret Anaby-Tavor Boaz Carmeli Esther Goldbraich Amir Kantor George Kour Segev Shlomov N. Tepper Naama Zwerdling 16 365 0 08 Nov 2019
What Would Elsa Do? Freezing Layers During Transformer Fine-Tuning Jaejun Lee Raphael Tang Jimmy J. Lin 28 121 0 08 Nov 2019
Why Do Masked Neural Language Models Still Need Common Sense Knowledge? Sunjae Kwon Cheongwoong Kang Jiyeon Han Jaesik Choi 19 16 0 08 Nov 2019
Assessing Social and Intersectional Biases in Contextualized Word Representations Y. Tan Elisa Celis FaML 27 223 0 04 Nov 2019
Deep Bidirectional Transformers for Relation Extraction without Supervision Yannis Papanikolaou Ian Roberts Andrea Pierleoni ViT 14 21 0 01 Nov 2019
Generalization through Memorization: Nearest Neighbor Language Models Urvashi Khandelwal Omer Levy Dan Jurafsky Luke Zettlemoyer M. Lewis RALM 53 810 0 01 Nov 2019