Mask The Bias: Improving Domain-Adaptive Generalization of CTC-based ASR with Internal Language Model Estimation

5 May 2023

Papers citing "Mask The Bias: Improving Domain-Adaptive Generalization of CTC-based ASR with Internal Language Model Estimation"

20 / 20 papers shown

Title
Internal Language Model Estimation Through Explicit Context Vector Learning for Attention-based Encoder-decoder ASR Yufei Liu Rao Ma Haihua Xu Yi He Zejun Ma Weibin Zhang 42 12 0 26 Jan 2022
A Likelihood Ratio based Domain Adaptation Method for E2E Models Chhavi Choudhury Ankur Gandhe Xiaohan Ding I. Bulyko 55 11 0 10 Jan 2022
On Language Model Integration for RNN Transducer based Speech Recognition Wei Zhou Zuoyun Zheng Ralf Schluter Hermann Ney 82 23 0 13 Oct 2021
ASR Adaptation for E-commerce Chatbots using Cross-Utterance Context and Multi-Task Language Modeling Ashish Shenoy S. Bodapati Katrin Kirchhoff 69 15 0 15 Jun 2021
Why does CTC result in peaky behavior? Albert Zeyer Ralf Schluter Hermann Ney 64 46 0 31 May 2021
Adapting Long Context NLM for ASR Rescoring in Conversational Agents Ashish Shenoy S. Bodapati Monica Sunkara S. Ronanki Katrin Kirchhoff 87 21 0 21 Apr 2021
Investigating Methods to Improve Language Model Integration for Attention-based Encoder-Decoder ASR Models Mohammad Zeineldeen Aleksandr Glushko Wilfried Michel Albert Zeyer Ralf Schluter Hermann Ney AuLLM 39 40 0 12 Apr 2021
Intermediate Loss Regularization for CTC-based Speech Recognition Jaesong Lee Shinji Watanabe 132 138 0 05 Feb 2021
Domain-aware Neural Language Models for Speech Recognition Linda Liu Yile Gu Aditya Gourav Ankur Gandhe Shashank Kalmane Denis Filimonov Ariya Rastrow I. Bulyko 89 21 0 05 Jan 2021
VoxPopuli: A Large-Scale Multilingual Speech Corpus for Representation Learning, Semi-Supervised Learning and Interpretation Changhan Wang M. Rivière Ann Lee Anne Wu Chaitanya Talnikar Daniel Haziza Mary Williamson J. Pino Emmanuel Dupoux SSL 100 488 0 02 Jan 2021
Deep Shallow Fusion for RNN-T Personalization Duc Le Gil Keren Julian Chan Jay Mahadeokar Christian Fuegen M. Seltzer 56 80 0 16 Nov 2020
Benchmarking LF-MMI, CTC and RNN-T Criteria for Streaming ASR Xiaohui Zhang Frank Zhang Chunxi Liu Kjell Schubert Julian Chan ... Jun Liu Ching-Feng Yeh Fuchun Peng Yatharth Saraf Geoffrey Zweig 63 20 0 09 Nov 2020
Internal Language Model Estimation for Domain-Adaptive End-to-End Speech Recognition Zhong Meng S. Parthasarathy Eric Sun Yashesh Gaur Naoyuki Kanda Liang Lu Xie Chen Rui Zhao Jinyu Li Jiawei Liu AuLLM 61 110 0 03 Nov 2020
CASS-NAT: CTC Alignment-based Single Step Non-autoregressive Transformer for Speech Recognition Ruchao Fan Wei Chu Peng Chang Jing Xiao 45 36 0 28 Oct 2020
Conformer: Convolution-augmented Transformer for Speech Recognition Anmol Gulati James Qin Chung-Cheng Chiu Niki Parmar Yu Zhang ... Wei Han Shibo Wang Zhengdong Zhang Yonghui Wu Ruoming Pang 223 3,139 0 16 May 2020
Hybrid Autoregressive Transducer (hat) Ehsan Variani David Rybach Cyril Allauzen Michael Riley 53 160 0 12 Mar 2020
A Density Ratio Approach to Language Model Fusion in End-To-End Automatic Speech Recognition Erik McDermott Hasim Sak Ehsan Variani 54 113 0 26 Feb 2020
A Comparison of Techniques for Language Model Integration in Encoder-Decoder Speech Recognition Shubham Toshniwal Anjuli Kannan Chung-Cheng Chiu Yonghui Wu Tara N. Sainath Karen Livescu 67 156 0 27 Jul 2018
ESPnet: End-to-End Speech Processing Toolkit Shinji Watanabe Takaaki Hori Shigeki Karita Tomoki Hayashi Jiro Nishitoba ... Jahn Heymann Sanjeev Khudanpur Nanxin Chen Adithya Renduchintala Tsubasa Ochiai VLM 109 1,507 0 30 Mar 2018
Deep Speech: Scaling up end-to-end speech recognition Awni Y. Hannun Carl Case Jared Casper Bryan Catanzaro G. Diamos ... R. Prenger S. Satheesh Shubho Sengupta Adam Coates A. Ng 180 2,128 0 17 Dec 2014