v1v2v3v4v5v6v7 (latest)

Attention Is All You Need

12 June 2017

Papers citing "Attention Is All You Need"

50 / 27,017 papers shown

Title
SkipNet: Learning Dynamic Routing in Convolutional Networks Xin Wang Feng Yu Zi-Yi Dou Trevor Darrell Joseph E. Gonzalez 119 640 0 26 Nov 2017
Convolutional Image Captioning J. Aneja Aditya Deshpande Alex Schwing VLM 137 361 0 24 Nov 2017
Non-local Neural Networks Xinyu Wang Ross B. Girshick Abhinav Gupta Kaiming He OffRL 366 8,931 0 21 Nov 2017
Speech recognition for medical conversations Chung-Cheng Chiu Anshuman Tripathi Katherine Chou Chris Co Navdeep Jaitly ... Ananth Sankar Justin Tansuwan Nathan Wan Yonghui Wu Xuedong Zhang LM&MA 70 84 0 20 Nov 2017
ATRank: An Attention-Based User Behavior Modeling Framework for Recommendation Chang Zhou Jinze Bai Junshuai Song Xiaofei Liu Zhengchao Zhao Xiusi Chen Jun Gao HAI 95 309 0 17 Nov 2017
Training Simplification and Model Simplification for Deep Learning: A Minimal Effort Back Propagation Method Xu Sun Xuancheng Ren Shuming Ma Bingzhen Wei Wei Li Jingjing Xu Houfeng Wang Yi Zhang 56 24 0 17 Nov 2017
Image Matters: Visually modeling user behaviors using Advanced Model Server T. Ge Liqin Zhao Guorui Zhou Keyu Chen Shuying Liu ... Sui Huang Qing Cui Xiaoqiang Zhu Yu Zhang Kun Gai 80 41 0 17 Nov 2017
Attend and Interact: Higher-Order Object Interactions for Video Understanding Chih-Yao Ma Asim Kadav I. Melvin Z. Kira G. Al-Regib H. Graf 80 145 0 16 Nov 2017
FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension Hsin-Yuan Huang Chenguang Zhu Yelong Shen Weizhu Chen FedML 87 183 0 16 Nov 2017
Motif-based Convolutional Neural Network on Graphs Aravind Sankar Xinyang Zhang Kevin Chen-Chuan Chang GNN 91 42 0 15 Nov 2017
Controllable Abstractive Summarization Angela Fan David Grangier Michael Auli 103 312 0 14 Nov 2017
Classical Structured Prediction Losses for Sequence to Sequence Learning Sergey Edunov Myle Ott Michael Auli David Grangier MarcÁurelio Ranzato AIMat 120 186 0 14 Nov 2017
QuickEdit: Editing Text & Translations by Crossing Words Out David Grangier Michael Auli KELM 61 10 0 13 Nov 2017
Few-Shot Learning with Graph Neural Networks Victor Garcia Satorras Joan Bruna GNN 182 1,241 0 10 Nov 2017
Attend and Diagnose: Clinical Time Series Analysis using Attention Models Huan-Zhi Song Deepta Rajan Jayaraman J. Thiagarajan A. Spanias MLAU 96 456 0 10 Nov 2017
Non-Autoregressive Neural Machine Translation Jiatao Gu James Bradbury Caiming Xiong Victor O.K. Li R. Socher 107 798 0 07 Nov 2017
Weighted Transformer Network for Machine Translation Karim Ahmed N. Keskar R. Socher 84 134 0 06 Nov 2017
Attentional Pooling for Action Recognition Rohit Girdhar Deva Ramanan 135 321 0 04 Nov 2017
Fixing a Broken ELBO Alexander A. Alemi Ben Poole Ian S. Fischer Joshua V. Dillon Rif A. Saurous Kevin Patrick Murphy DRL BDL 101 80 0 01 Nov 2017
Paraphrase Generation with Deep Reinforcement Learning Zichao Li Xin Jiang Lifeng Shang Hang Li OffRL 124 214 0 01 Nov 2017
DCN+: Mixed Objective and Deep Residual Coattention for Question Answering Caiming Xiong Victor Zhong R. Socher 96 109 0 31 Oct 2017
Graph Attention Networks Petar Velickovic Guillem Cucurull Arantxa Casanova Adriana Romero Pietro Lio Yoshua Bengio GNN 495 20,343 0 30 Oct 2017
Phase Conductor on Multi-layered Attentions for Machine Comprehension R. Liu Wei Wei Weiguang Mao M. Chikina 92 22 0 28 Oct 2017
Attending to All Mention Pairs for Full Abstract Biological Relation Extraction Pat Verga Emma Strubell O. Shai Andrew McCallum 3DV 46 11 0 23 Oct 2017
ActivityNet Challenge 2017 Summary Guohao Li Juan Carlos Niebles Cees G. M. Snoek Fabian Caba Heilbron Humam Alwassel Ranjay Krishna Victor Escorcia Kenji Hata S. Buch 105 48 0 22 Oct 2017
Deep Voice 3: Scaling Text-to-Speech with Convolutional Sequence Learning Ming-Yu Liu Kainan Peng Andrew Gibiansky Sercan O. Arik Ajay Kannan Sharan Narang Jonathan Raiman John Miller 90 309 0 20 Oct 2017
Searching for Activation Functions Prajit Ramachandran Barret Zoph Quoc V. Le 97 612 0 16 Oct 2017
Social Attention: Modeling Attention in Human Crowds Anirudh Vemula Katharina Muelling Jean Oh HAI 73 645 0 12 Oct 2017
Low-Rank RNN Adaptation for Context-Aware Language Modeling Aaron Jaech Mari Ostendorf 72 25 0 06 Oct 2017
Enhanced Neural Machine Translation by Learning from Draft Aodong Li Shiyue Zhang Dong Wang Tianshi Zheng AIMat 59 5 0 04 Oct 2017
Improving Lexical Choice in Neural Machine Translation Toan Q. Nguyen David Chiang 86 86 0 03 Oct 2017
Attentive Convolution: Equipping CNNs with RNN-style Attention Mechanisms Wenpeng Yin Hinrich Schütze 85 42 0 02 Oct 2017
Application of a Hybrid Bi-LSTM-CRF model to the task of Russian Named Entity Recognition L. T. Anh M. Y. Arkhipov M. Burtsev 29 37 0 27 Sep 2017
Generating Sentences by Editing Prototypes Kelvin Guu Tatsunori B. Hashimoto Yonatan Oren Percy Liang 171 316 0 26 Sep 2017
The Consciousness Prior Yoshua Bengio DRL AI4CE 70 231 0 25 Sep 2017
Code Attention: Translating Code to Comments by Exploiting Domain Features Wenhao Zheng Hong-Yu Zhou Ming Li Jianxin Wu 23 19 0 22 Sep 2017
Neural Networks for Text Correction and Completion in Keyboard Decoding Shaon Ghosh Per Ola Kristensson HAI 49 69 0 19 Sep 2017
Self-Attentive Residual Decoder for Neural Machine Translation Lesly Miculicich Nikolaos Pappas Dhananjay Ram Andrei Popescu-Belis 52 20 0 14 Sep 2017
DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding Tao Shen Dinesh Manocha Guodong Long Jing Jiang Shirui Pan Chengqi Zhang 110 757 0 14 Sep 2017
Natural Language Inference over Interaction Space Yichen Gong Heng Luo Jian Zhang 108 265 0 13 Sep 2017
Refining Source Representations with Relation Networks for Neural Machine Translation Wen Zhang Jiawei Hu Yang Feng Qun Liu 41 7 0 12 Sep 2017
Simple Recurrent Units for Highly Parallelizable Recurrence Tao Lei Yu Zhang Sida I. Wang Huijing Dai Yoav Artzi LRM 160 277 0 08 Sep 2017
Deep Learning Techniques for Music Generation -- A Survey Jean-Pierre Briot Gaëtan Hadjeres F. Pachet MGen 150 301 0 05 Sep 2017
Squeeze-and-Excitation Networks Jie Hu Li Shen Samuel Albanie Gang Sun Enhua Wu 431 26,653 0 05 Sep 2017
Natural Language Processing: State of The Art, Current Trends and Challenges Diksha Khurana Aditya Koli Kiran Khatter Sukhdev Singh 65 1,073 0 17 Aug 2017
Revisiting the Effectiveness of Off-the-shelf Temporal Modeling Approaches for Large-scale Video Classification Yunlong Bian Chuang Gan Xiao-Chang Liu Fu Li Xiang Long Yandong Li Heng Qi Jie Zhou Shilei Wen Yuanqing Lin 85 48 0 12 Aug 2017
Beyond Bilinear: Generalized Multimodal Factorized High-order Pooling for Visual Question Answering Zhou Yu Jun-chen Yu Chenchao Xiang Jianping Fan Dacheng Tao 95 461 0 10 Aug 2017
Recent Trends in Deep Learning Based Natural Language Processing Tom Young Devamanyu Hazarika Soujanya Poria Min Zhang 97 2,846 0 09 Aug 2017
Deep Architectures for Neural Machine Translation Antonio Valerio Miceli Barone Jindřich Helcl Rico Sennrich Barry Haddow Alexandra Birch 88 112 0 24 Jul 2017
A Simple Neural Attentive Meta-Learner Nikhil Mishra Mostafa Rohaninejad Xi Chen Pieter Abbeel OOD 109 200 0 11 Jul 2017