Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books

22 June 2015

Antonio Torralba

Sanja Fidler

ArXiv PDF HTML

Papers citing "Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books"

50 / 523 papers shown

Title
EdgeTran: Co-designing Transformers for Efficient Inference on Mobile Edge Platforms Shikhar Tuli N. Jha 36 3 0 24 Mar 2023
Machine Learning for Brain Disorders: Transformers and Visual Transformers Robin Courant Maika Edberg Nicolas Dufour Vicky Kalogeiton MedIm ViT 37 1 0 21 Mar 2023
Neural Architecture Search for Effective Teacher-Student Knowledge Transfer in Language Models Aashka Trivedi Takuma Udagawa Michele Merler Yikang Shen Yousef El-Kurdi Bishwaranjan Bhattacharjee 30 7 0 16 Mar 2023
A Multi-Grained Self-Interpretable Symbolic-Neural Model For Single/Multi-Labeled Text Classification Xiang Hu Xinyu Kong Kewei Tu MILM BDL 31 5 0 06 Mar 2023
Duration-aware pause insertion using pre-trained language model for multi-speaker text-to-speech Ke Wang Tomoki Koriyama Yuki Saito Takaaki Saeki Detai Xin Hiroshi Saruwatari 23 7 0 27 Feb 2023
MUX-PLMs: Data Multiplexing for High-throughput Language Models Vishvak Murahari Ameet Deshpande Carlos E. Jimenez Izhak Shafran Mingqiu Wang Yuan Cao Karthik Narasimhan MoE 26 5 0 24 Feb 2023
$k$ NN-Adapter: Efficient Domain Adaptation for Black-Box Language Models Yangsibo Huang Daogao Liu Zexuan Zhong Weijia Shi Y. Lee RALM ALM 38 14 0 21 Feb 2023
HomoDistil: Homotopic Task-Agnostic Distillation of Pre-trained Transformers Chen Liang Haoming Jiang Zheng Li Xianfeng Tang Bin Yin Tuo Zhao VLM 27 24 0 19 Feb 2023
Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous Pronouns Zhongbin Xie Vid Kocijan Thomas Lukasiewicz Oana-Maria Camburu 10 2 0 11 Feb 2023
GLADIS: A General and Large Acronym Disambiguation Benchmark Lihu Chen Gaël Varoquaux Fabian M. Suchanek ELM 31 4 0 03 Feb 2023
Mnemosyne: Learning to Train Transformers with Transformers Deepali Jain K. Choromanski Kumar Avinava Dubey Sumeet Singh Vikas Sindhwani Tingnan Zhang Jie Tan OffRL 39 9 0 02 Feb 2023
FAVOR#: Sharp Attention Kernel Approximations via New Classes of Positive Random Features Valerii Likhosherstov K. Choromanski Kumar Avinava Dubey Frederick Liu Tamás Sarlós Adrian Weller 23 3 0 01 Feb 2023
SPEC5G: A Dataset for 5G Cellular Network Protocol Analysis Imtiaz Karim Kazi Samin Mubasshir Mirza Masfiqur Rahman Elisa Bertino 19 22 0 22 Jan 2023
Learning-Rate-Free Learning by D-Adaptation Aaron Defazio Konstantin Mishchenko 30 77 0 18 Jan 2023
EXIF as Language: Learning Cross-Modal Associations Between Images and Camera Metadata Chenhao Zheng Ayush Shrivastava Andrew Owens VLM 33 11 0 11 Jan 2023
Multimodal Inverse Cloze Task for Knowledge-based Visual Question Answering Paul Lerner O. Ferret C. Guinaudeau 21 9 0 11 Jan 2023
Does compressing activations help model parallel training? S. Bian Dacheng Li Hongyi Wang Eric P. Xing Shivaram Venkataraman 19 5 0 06 Jan 2023
ORCA: A Challenging Benchmark for Arabic Language Understanding AbdelRahim Elmadany El Moatez Billah Nagoudi Muhammad Abdul-Mageed ELM 17 40 0 21 Dec 2022
Efficient Long Sequence Modeling via State Space Augmented Transformer Simiao Zuo Xiaodong Liu Jian Jiao Denis Xavier Charles Eren Manavoglu Tuo Zhao Jianfeng Gao 125 36 0 15 Dec 2022
The Effects of In-domain Corpus Size on pre-training BERT Chris Sanchez Zheyu Zhang AI4CE 16 4 0 15 Dec 2022
Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language Alexei Baevski Arun Babu Wei-Ning Hsu Michael Auli VLM SSL 32 92 0 14 Dec 2022
Towards Linguistically Informed Multi-Objective Pre-Training for Natural Language Inference Maren Pielka Svetlana Schmidt Lisa Pucknat R. Sifa CLIP AI4CE 19 2 0 14 Dec 2022
DexBERT: Effective, Task-Agnostic and Fine-grained Representation Learning of Android Bytecode Tiezhu Sun Kevin Allix Kisub Kim Xin Zhou Dongsun Kim David Lo Tegawende F. Bissyande Jacques Klein 24 11 0 12 Dec 2022
A Generative Approach for Script Event Prediction via Contrastive Fine-tuning Fangqi Zhu Jun Gao Changlong Yu Wei Wang Cheng-Xian Xu Xin Mu Min Yang Ruifeng Xu 22 11 0 07 Dec 2022
Momentum Decoding: Open-ended Text Generation As Graph Exploration Tian Lan Yixuan Su Shuhang Liu Heyan Huang Xian-Ling Mao 47 5 0 05 Dec 2022
Language Model Pre-training on True Negatives ZhuoSheng Zhang Hai Zhao Masao Utiyama Eiichiro Sumita 34 2 0 01 Dec 2022
Using Selective Masking as a Bridge between Pre-training and Fine-tuning Tanish Lad Himanshu Maheshwari Shreyas Kottukkal R. Mamidi 24 3 0 24 Nov 2022
Semi-Supervised Lifelong Language Learning Ying Zhao Yinhe Zheng Yu Bowen Zhiliang Tian Dongkyu Lee Jian Sun Haiyang Yu Yongbin Li N. Zhang CLL KELM 43 3 0 23 Nov 2022
Word-Level Representation From Bytes For Language Modeling Chul Lee Qipeng Guo Xipeng Qiu 23 1 0 23 Nov 2022
Uni-Perceiver v2: A Generalist Model for Large-Scale Vision and Vision-Language Tasks Hao Li Jinguo Zhu Xiaohu Jiang Xizhou Zhu Hongsheng Li ... Xiaohua Wang Yu Qiao Xiaogang Wang Wenhai Wang Jifeng Dai MLLM 26 55 0 17 Nov 2022
An Efficient Active Learning Pipeline for Legal Text Classification Sepideh Mamooler R. Lebret Stéphane Massonnet Karl Aberer AILaw 27 4 0 15 Nov 2022
Cross-Reality Re-Rendering: Manipulating between Digital and Physical Realities Siddhartha Datta 33 0 0 15 Nov 2022
A Survey for Efficient Open Domain Question Answering Qin Zhang Shan Chen Dongkuan Xu Qingqing Cao Xiaojun Chen Trevor Cohn Meng Fang 28 33 0 15 Nov 2022
Cracking Double-Blind Review: Authorship Attribution with Deep Learning L. Bauersfeld Angel Romero Manasi Muglikar Davide Scaramuzza 19 5 0 14 Nov 2022
Language models are good pathologists: using attention-based sequence reduction and text-pretrained transformers for efficient WSI classification Juan Pisula Katarzyna Bozek VLM MedIm 36 3 0 14 Nov 2022
SocioProbe: What, When, and Where Language Models Learn about Sociodemographics Anne Lauscher Federico Bianchi Samuel R. Bowman Dirk Hovy 32 7 0 08 Nov 2022
Reconciliation of Pre-trained Models and Prototypical Neural Networks in Few-shot Named Entity Recognition Youcheng Huang Wenqiang Lei Jie Fu Jiancheng Lv 19 3 0 07 Nov 2022
Hierarchical Multi-Label Classification of Scientific Documents Mobashir Sadat Cornelia Caragea 19 18 0 05 Nov 2022
KGLM: Integrating Knowledge Graph Structure in Language Models for Link Prediction Jason Youn I. Tagkopoulos KELM 22 20 0 04 Nov 2022
Multi-level Distillation of Semantic Knowledge for Pre-training Multilingual Language Model Mingqi Li Fei Ding Dan Zhang Long Cheng Hongxin Hu Feng Luo 41 6 0 02 Nov 2022
WHEN FLUE MEETS FLANG: Benchmarks and Large Pre-trained Language Model for Financial Domain Raj Sanjay Shah Kunal Chawla Dheeraj Eidnani Agam Shah Wendi Du S. Chava Natraj Raman Charese Smiley Jiaao Chen Diyi Yang AIFin 37 103 0 31 Oct 2022
Transformers meet Stochastic Block Models: Attention with Data-Adaptive Sparsity and Cost Sungjun Cho Seonwoo Min Jinwoo Kim Moontae Lee Honglak Lee Seunghoon Hong 40 3 0 27 Oct 2022
Fast DistilBERT on CPUs Haihao Shen Ofir Zafrir Bo Dong Hengyu Meng Xinyu. Ye Zhe Wang Yi Ding Hanwen Chang Guy Boudoukh Moshe Wasserblat VLM 29 2 0 27 Oct 2022
Contrastive Decoding: Open-ended Text Generation as Optimization Xiang Lisa Li Ari Holtzman Daniel Fried Percy Liang Jason Eisner Tatsunori Hashimoto Luke Zettlemoyer M. Lewis 51 326 0 27 Oct 2022
Same Pre-training Loss, Better Downstream: Implicit Bias Matters for Language Models Hong Liu Sang Michael Xie Zhiyuan Li Tengyu Ma AI4CE 40 49 0 25 Oct 2022
Exploring Mode Connectivity for Pre-trained Language Models Yujia Qin Cheng Qian Jing Yi Weize Chen Yankai Lin Xu Han Zhiyuan Liu Maosong Sun Jie Zhou 29 20 0 25 Oct 2022
ExPUNations: Augmenting Puns with Keywords and Explanations Jiao Sun Anjali Narayan-Chen Shereen Oraby Alessandra Cervone Tagyoung Chung Jing Huang Yang Liu Nanyun Peng 19 10 0 24 Oct 2022
Exploring the Value of Pre-trained Language Models for Clinical Named Entity Recognition Yuping Wu Lifeng Han Valerio Antonini Goran Nenadic 33 4 0 23 Oct 2022
Amos: An Adam-style Optimizer with Adaptive Weight Decay towards Model-Oriented Scale Ran Tian Ankur P. Parikh ODL 23 6 0 21 Oct 2022
AugCSE: Contrastive Sentence Embedding with Diverse Augmentations Zilu Tang Muhammed Yusuf Kocyigit Derry Wijaya 35 9 0 20 Oct 2022