Transformer-Transducer: End-to-End Speech Recognition with Self-Attention

28 October 2019

Papers citing "Transformer-Transducer: End-to-End Speech Recognition with Self-Attention"

50 / 102 papers shown

Title
Context-Aware Transformer Transducer for Speech Recognition Feng-Ju Chang Jing Liu Martin H. Radfar Athanasios Mouchtaris M. Omologo Ariya Rastrow Siegfried Kunzmann 18 79 0 05 Nov 2021
Recent Advances in End-to-End Automatic Speech Recognition Jinyu Li VLM 29 363 0 02 Nov 2021
Cross-attention conformer for context modeling in speech enhancement for ASR A. Narayanan Chung-Cheng Chiu Tom O'Malley Quan Wang Yanzhang He 24 14 0 30 Oct 2021
Streaming Transformer Transducer Based Speech Recognition Using Non-Causal Convolution Yangyang Shi Chunyang Wu Dilin Wang Alex Xiao Jay Mahadeokar ... Ke Li Yuan Shangguan Varun K. Nagaraja Ozlem Kalinli M. Seltzer 33 15 0 07 Oct 2021
Factorized Neural Transducer for Efficient Language Model Adaptation Xie Chen Zhong Meng S. Parthasarathy Jinyu Li 21 39 0 27 Sep 2021
Turn-to-Diarize: Online Speaker Diarization Constrained by Transformer Transducer Speaker Turn Detection Wei Xia Han Lu Quan Wang Anshuman Tripathi Yiling Huang Ignacio López Moreno Hasim Sak 41 51 0 23 Sep 2021
Performance-Efficiency Trade-offs in Unsupervised Pre-training for Speech Recognition Felix Wu Kwangyoun Kim Jing Pan Kyu Jeong Han Kilian Q. Weinberger Yoav Artzi 27 71 0 14 Sep 2021
Multi-Channel Transformer Transducer for Speech Recognition Feng-Ju Chang Martin H. Radfar Athanasios Mouchtaris M. Omologo 18 19 0 30 Aug 2021
A Light-weight contextual spelling correction model for customizing transducer-based speech recognition systems Xiaoqiang Wang Yanqing Liu Sheng Zhao Jinyu Li KELM 13 15 0 17 Aug 2021
CarneliNet: Neural Mixture Model for Automatic Speech Recognition A. Kalinov Somshubra Majumdar Jagadeesh Balam Boris Ginsburg MoE 24 3 0 22 Jul 2021
A Configurable Multilingual Model is All You Need to Recognize All Languages Long Zhou Jinyu Li Eric Sun Shujie Liu 92 40 0 13 Jul 2021
Multi-mode Transformer Transducer with Stochastic Future Context Kwangyoun Kim Felix Wu Prashant Sridhar Kyu Jeong Han Shinji Watanabe 30 9 0 17 Jun 2021
CoDERT: Distilling Encoder Representations with Co-learning for Transducer-based Speech Recognition R. Swaminathan Brian King Grant P. Strimel J. Droppo Athanasios Mouchtaris 20 15 0 14 Jun 2021
Reducing Streaming ASR Model Delay with Self Alignment Jaeyoung Kim Han Lu Anshuman Tripathi Qian Zhang Hasim Sak 14 20 0 06 May 2021
On Addressing Practical Challenges for RNN-Transducer Rui Zhao Jian Xue Jinyu Li Wenning Wei Lei He Jiawei Liu 17 30 0 27 Apr 2021
Bridging the gap between streaming and non-streaming ASR systems bydistilling ensembles of CTC and RNN-T models Thibault Doutre Wei Han Chung-Cheng Chiu Ruoming Pang Olivier Siohan Liangliang Cao 30 5 0 25 Apr 2021
FSR: Accelerating the Inference Process of Transducer-Based Models by Applying Fast-Skip Regularization Zhengkun Tian Jiangyan Yi Ye Bai J. Tao Shuai Zhang Zhengqi Wen 23 16 0 07 Apr 2021
Flexi-Transducer: Optimizing Latency, Accuracy and Compute forMulti-Domain On-Device Scenarios Jay Mahadeokar Yangyang Shi Yuan Shangguan Chunyang Wu Alex Xiao Hang Su Duc Le Ozlem Kalinli Christian Fuegen M. Seltzer 16 3 0 06 Apr 2021
Dynamic Encoder Transducer: A Flexible Solution For Trading Off Accuracy For Latency Yangyang Shi Varun K. Nagaraja Chunyang Wu Jay Mahadeokar Duc Le ... Ching-Feng Yeh Julian Chan Christian Fuegen Ozlem Kalinli M. Seltzer 27 15 0 05 Apr 2021
TSNAT: Two-Step Non-Autoregressvie Transformer Models for Speech Recognition Zhengkun Tian Jiangyan Yi J. Tao Ye Bai Shuai Zhang Zhengqi Wen Xuefei Liu 9 19 0 04 Apr 2021
Advancing RNN Transducer Technology for Speech Recognition G. Saon Zoltan Tueske Daniel Bolaños Brian Kingsbury 34 86 0 17 Mar 2021
Learning Word-Level Confidence For Subword End-to-End ASR David Qiu Qiujia Li Yanzhang He Yu Zhang Bo-wen Li ... Deepti Bhatia Wei Li Ke Hu Tara N. Sainath Ian McGraw 24 32 0 11 Mar 2021
Unidirectional Memory-Self-Attention Transducer for Online Speech Recognition Jian Luo Jianzong Wang Ning Cheng Jing Xiao RALM 12 6 0 23 Feb 2021
Thank you for Attention: A survey on Attention-based Artificial Neural Networks for Automatic Speech Recognition Priyabrata Karmakar S. Teng Guojun Lu 19 25 0 14 Feb 2021
Transformer Based Deliberation for Two-Pass Speech Recognition Ke Hu Ruoming Pang Tara N. Sainath Trevor Strohman 18 37 0 27 Jan 2021
Less Is More: Improved RNN-T Decoding Using Limited Label Context and Path Merging Rohit Prabhavalkar Yanzhang He David Rybach S. Campbell A. Narayanan Trevor Strohman Tara N. Sainath 41 35 0 12 Dec 2020
Transformer-Transducers for Code-Switched Speech Recognition Siddharth Dalmia Yuzong Liu S. Ronanki Katrin Kirchhoff 9 47 0 30 Nov 2020
Efficient End-to-End Speech Recognition Using Performers in Conformers Peidong Wang DeLiang Wang 17 3 0 09 Nov 2020
Streaming Attention-Based Models with Augmented Memory for End-to-End Speech Recognition Ching-Feng Yeh Yongqiang Wang Yangyang Shi Chunyang Wu Frank Zhang Julian Chan M. Seltzer AI4TS RALM 23 8 0 03 Nov 2020
Multitask Learning and Joint Optimization for Transformer-RNN-Transducer Speech Recognition J. Jeon Eesung Kim 4 13 0 02 Nov 2020
Cascaded encoders for unifying streaming and non-streaming ASR A. Narayanan Tara N. Sainath Ruoming Pang Jiahui Yu Chung-Cheng Chiu Rohit Prabhavalkar Ehsan Variani Trevor Strohman AuLLM 6 85 0 27 Oct 2020
Transformer-based End-to-End Speech Recognition with Local Dense Synthesizer Attention Menglong Xu Shengqiang Li Xiao-Lei Zhang 27 31 0 23 Oct 2020
Improving Streaming Automatic Speech Recognition With Non-Streaming Model Distillation On Unsupervised Data Thibault Doutre Wei Han Min Ma Zhiyun Lu Chung-Cheng Chiu Ruoming Pang A. Narayanan Ananya Misra Yu Zhang Liangliang Cao 61 22 0 22 Oct 2020
Developing Real-time Streaming Transformer Transducer for Speech Recognition on Large-scale Dataset Xie Chen Yu-Huan Wu Zhenghao Wang Shujie Liu Jinyu Li 22 169 0 22 Oct 2020
FastEmit: Low-latency Streaming ASR with Sequence-level Emission Regularization Jiahui Yu Chung-Cheng Chiu Bo-wen Li Shuo-yiin Chang Tara N. Sainath ... A. Narayanan Wei Han Anmol Gulati Yonghui Wu Ruoming Pang 15 90 0 21 Oct 2020
Emformer: Efficient Memory Transformer Based Acoustic Model For Low Latency Streaming Speech Recognition Yangyang Shi Yongqiang Wang Chunyang Wu Ching-Feng Yeh Julian Chan Frank Zhang Duc Le M. Seltzer 56 168 0 21 Oct 2020
Dual-mode ASR: Unify and Improve Streaming ASR with Full-context Modeling Jiahui Yu Wei Han Anmol Gulati Chung-Cheng Chiu Bo-wen Li Tara N. Sainath Yonghui Wu Ruoming Pang 19 18 0 12 Oct 2020
Parallel Rescoring with Transformer for Streaming On-Device Speech Recognition Wei Li James Qin Chung-Cheng Chiu Ruoming Pang Yanzhang He 9 14 0 30 Aug 2020
Adaptation Algorithms for Neural Network-Based Speech Recognition: An Overview P. Bell Joachim Fainberg Ondˇrej Klejch Jinyu Li Steve Renals P. Swietojanski 46 74 0 14 Aug 2020
Conv-Transformer Transducer: Low Latency, Low Frame Rate, Streamable End-to-End Speech Recognition Wenyong Huang Wenchao Hu Y. Yeung Xiao Chen 11 50 0 13 Aug 2020
Subword Regularization: An Analysis of Scalability and Generalization for End-to-End Automatic Speech Recognition Egor Lakomkin Jahn Heymann Ilya Sklyar Simon Wiesler 9 8 0 10 Aug 2020
Multi-view Frequency LSTM: An Efficient Frontend for Automatic Speech Recognition Maarten Van Segbroeck Sri Harish Reddy Mallidi Brian King I-Fan Chen Gurpreet Chadha Roland Maas VLM AI4TS 11 7 0 30 Jun 2020
Data Movement Is All You Need: A Case Study on Optimizing Transformers A. Ivanov Nikoli Dryden Tal Ben-Nun Shigang Li Torsten Hoefler 30 131 0 30 Jun 2020
A Further Study of Unsupervised Pre-training for Transformer Based Speech Recognition Dongwei Jiang Wubo Li Ruixiong Zhang Miao Cao Ne Luo Yang Han Wei Zou Xiangang Li SSL 25 29 0 20 May 2020
A New Training Pipeline for an Improved Neural Transducer Albert Zeyer André Merboldt Ralf Schluter Hermann Ney AI4TS MedIm 14 52 0 19 May 2020
Weak-Attention Suppression For Transformer Based Speech Recognition Yangyang Shi Yongqiang Wang Chunyang Wu Christian Fuegen Frank Zhang Duc Le Ching-Feng Yeh M. Seltzer 16 18 0 18 May 2020
Attention-based Transducer for Online Speech Recognition Bin Wang Yan Yin Hui-Ching Lin 18 4 0 18 May 2020
Streaming Transformer-based Acoustic Models Using Self-attention with Augmented Memory Chunyang Wu Yongqiang Wang Yangyang Shi Ching-Feng Yeh Frank Zhang RALM 15 60 0 16 May 2020
Research on Modeling Units of Transformer Transducer for Mandarin Speech Recognition Li Fu Xiaoxiao Li Libo Zi 8 5 0 26 Apr 2020
Towards a Competitive End-to-End Speech Recognition for CHiME-6 Dinner Party Transcription A. Andrusenko A. Laptev Ivan Medennikov 17 16 0 22 Apr 2020