Improving Hybrid CTC/Attention End-to-end Speech Recognition with
Pretrained Acoustic and Language Model

Improving Hybrid CTC/Attention End-to-end Speech Recognition with Pretrained Acoustic and Language Model

14 December 2021

Papers citing "Improving Hybrid CTC/Attention End-to-end Speech Recognition with Pretrained Acoustic and Language Model"

18 / 18 papers shown

Title
Privacy-Preserving End-to-End Spoken Language Understanding Ying-Gui Wang Wei Huang Le Yang PILM 43 5 0 22 Mar 2024
Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey Hamza Kheddar Mustapha Hemis Yassine Himeur OffRL 46 59 0 02 Mar 2024
Text-Only Domain Adaptation for End-to-End Speech Recognition through Down-Sampling Acoustic Representation Jiaxu Zhu Weinan Tong Yaoxun Xu Chang Song Zhiyong Wu Zhao You Dan Su Dong Yu Helen M. Meng 32 0 0 04 Sep 2023
Decoupled Structure for Improved Adaptability of End-to-End Models Keqi Deng P. Woodland AuLLM 27 2 0 25 Aug 2023
Spoken Question Answering and Speech Continuation Using Spectrogram-Powered LLM Eliya Nachmani Alon Levkovitch Roy Hirsch Julián Salazar Chulayutsh Asawaroengchai Soroosh Mariooryad Ehud Rivlin RJ Skerry-Ryan Michelle Tadmor Ramanovich AuLLM 34 34 0 24 May 2023
DistillW2V2: A Small and Streaming Wav2vec 2.0 Based ASR Model Yanzhe Fu Yueteng Kang Songjun Cao Long Ma 19 7 0 16 Mar 2023
Adaptable End-to-End ASR Models using Replaceable Internal LMs and Residual Softmax Keqi Deng P. Woodland AuLLM KELM 37 11 0 16 Feb 2023
Multi-Label Training for Text-Independent Speaker Identification Yuqi Xue 27 0 0 14 Nov 2022
BECTRA: Transducer-based End-to-End ASR with BERT-Enhanced Encoder Yosuke Higuchi Tetsuji Ogawa Tetsunori Kobayashi Shinji Watanabe 59 13 0 02 Nov 2022
BERT Meets CTC: New Formulation of End-to-End Speech Recognition with Pre-trained Masked Language Model Yosuke Higuchi Brian Yan Siddhant Arora Tetsuji Ogawa Tetsunori Kobayashi Shinji Watanabe 54 25 0 29 Oct 2022
A context-aware knowledge transferring strategy for CTC-based ASR Keda Lu Kuan-Yu Chen 15 15 0 12 Oct 2022
Improving Streaming End-to-End ASR on Transformer-based Causal Models with Encoder States Revision Strategies Zehan Li Haoran Miao Keqi Deng Gaofeng Cheng Sanli Tian Ta Li Yonghong Yan KELM 27 4 0 06 Jul 2022
Improving Deliberation by Text-Only and Semi-Supervised Training Ke Hu Tara N. Sainath Yanzhang He Rohit Prabhavalkar Trevor Strohman S. Mavandadi Weiran Wang 34 12 0 29 Jun 2022
A Complementary Joint Training Approach Using Unpaired Speech and Text for Low-Resource Automatic Speech Recognition Ye Du Jie Zhang Qiu-shi Zhu Lirong Dai Ming Wu Xin Fang Zhouwang Yang 34 2 0 05 Apr 2022
Enhancing Speech Recognition Decoding via Layer Aggregation Tomer Wullach Shlomo E. Chazan 32 1 0 21 Mar 2022
Improving CTC-based speech recognition via knowledge transferring from pre-trained language models Keqi Deng Songjun Cao Yike Zhang Long Ma Gaofeng Cheng Ji Xu Pengyuan Zhang 8 27 0 22 Feb 2022
Improving non-autoregressive end-to-end speech recognition with pre-trained acoustic and language models Keqi Deng Zehui Yang Shinji Watanabe Yosuke Higuchi Gaofeng Cheng Pengyuan Zhang 25 23 0 25 Jan 2022
Efficiently Fusing Pretrained Acoustic and Linguistic Encoders for Low-resource Speech Recognition Cheng Yi Shiyu Zhou Bo Xu 51 40 0 17 Jan 2021