AV Taris: Online Audio-Visual Speech Recognition

14 December 2020

Papers citing "AV Taris: Online Audio-Visual Speech Recognition"

22 / 22 papers shown

Title
Learning to Count Words in Fluent Speech enables Online Speech Recognition George Sterpu Christian Saam N. Harte 21 4 0 08 Jun 2020
A Comparison of Label-Synchronous and Frame-Synchronous End-to-End Models for Speech Recognition Linhao Dong Cheng Yi Jianzong Wang Shiyu Zhou Shuang Xu X. Jia Bo Xu 39 17 0 20 May 2020
Should we hard-code the recurrence concept or learn it instead ? Exploring the Transformer architecture for Audio-Visual Speech Recognition George Sterpu Christian Saam N. Harte 29 7 0 19 May 2020
How to Teach DNNs to Pay Attention to the Visual Modality in Speech Recognition George Sterpu Christian Saam N. Harte 44 29 0 17 Apr 2020
A Streaming On-Device End-to-End Model Surpassing Server-Side Conventional Model Quality and Latency Tara N. Sainath Yanzhang He Yue Liu A. Narayanan Ruoming Pang ... Trevor Strohman Mirkó Visontai Yonghui Wu Yu Zhang Ding Zhao 38 215 0 28 Mar 2020
Recurrent Neural Network Transducer for Audio-Visual Speech Recognition Takaki Makino H. Liao Yannis Assael Brendan Shillingford Basi García Otavio Braga Olivier Siohan 39 129 0 08 Nov 2019
A comparison of end-to-end models for long-form speech recognition Chung-Cheng Chiu Wei Han Yu Zhang Ruoming Pang S. Kishchenko ... Anjuli Kannan Rohit Prabhavalkar Zhiwen Chen Tara N. Sainath Yonghui Wu AuLLM 41 82 0 06 Nov 2019
Recognizing long-form speech using streaming end-to-end models A. Narayanan Rohit Prabhavalkar Chung-Cheng Chiu David Rybach Tara N. Sainath Trevor Strohman 36 129 0 24 Oct 2019
CIF: Continuous Integrate-and-Fire for End-to-End Speech Recognition Linhao Dong Bo Xu 47 127 0 27 May 2019
Attention-based Audio-Visual Fusion for Robust Automatic Speech Recognition George Sterpu Christian Saam N. Harte 46 65 0 05 Sep 2018
End-to-end Speech Recognition with Adaptive Computation Steps Mohan Li Min Liu Masanori Hattori 15 33 0 30 Aug 2018
The fifth 'CHiME' Speech Separation and Recognition Challenge: Dataset, task and baselines Jon Barker Shinji Watanabe Emmanuel Vincent J. Trmal 35 680 0 28 Mar 2018
State-of-the-art Speech Recognition With Sequence-to-Sequence Models Chung-Cheng Chiu Tara N. Sainath Yonghui Wu Rohit Prabhavalkar Patrick Nguyen ... Katya Gonina Navdeep Jaitly Yue Liu J. Chorowski M. Bacchiani AI4TS 73 1,150 0 05 Dec 2017
Exploring Neural Transducers for End-to-End Speech Recognition Eric Battenberg Jitong Chen R. Child Adam Coates Yashesh Gaur Yi Li ... Hairong Liu S. Satheesh David Seetapun Anuroop Sriram Zhenyao Zhu AI4TS 56 230 0 24 Jul 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 331 129,831 0 12 Jun 2017
English Conversational Telephone Speech Recognition by Humans and Machines G. Saon Gakuto Kurata Tom Sercu Kartik Audhkhasi Samuel Thomas ... Bhuvana Ramabhadran M. Picheny L. Lim Bergul Roomi Phil Hall 47 365 0 06 Mar 2017
Identity Mappings in Deep Residual Networks Kaiming He Xinming Zhang Shaoqing Ren Jian Sun 262 10,149 0 16 Mar 2016
Listen, Attend and Spell William Chan Navdeep Jaitly Quoc V. Le Oriol Vinyals RALM 123 2,257 0 05 Aug 2015
Attention-Based Models for Speech Recognition J. Chorowski Dzmitry Bahdanau Dmitriy Serdyuk Kyunghyun Cho Yoshua Bengio 88 2,602 0 24 Jun 2015
Sequence to Sequence Learning with Neural Networks Ilya Sutskever Oriol Vinyals Quoc V. Le AIMat 257 20,467 0 10 Sep 2014
Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation Kyunghyun Cho B. V. Merrienboer Çağlar Gülçehre Dzmitry Bahdanau Fethi Bougares Holger Schwenk Yoshua Bengio AIMat 563 23,235 0 03 Jun 2014
Sequence Transduction with Recurrent Neural Networks Alex Graves 103 1,858 0 14 Nov 2012