v1v2v3 (latest)

Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition

16 June 2022

Papers citing "Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition"

21 / 21 papers shown

Title
MFA-KWS: Effective Keyword Spotting with Multi-head Frame-asynchronous Decoding Yu Xi Haoyu Li Xiaoyu Gu Yidi Jiang Kai Yu 56 1 0 26 May 2025
The Multimodal Information Based Speech Processing (MISP) 2025 Challenge: Audio-Visual Diarization and Recognition Ming Gao Shilong Wu Hang Chen Jun Du Chin-Hui Lee Shinji Watanabe Jingdong Chen Siniscalchi Sabato Marco O. Scharenborg 61 3 0 20 May 2025
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities Wei Wei Jintao Guo Shanshan Zhao Minghao Fu Lunhao Duan Guo-Hua Wang Qing-Guo Chen Zhao Xu Weihua Luo Kaifu Zhang DiffM 293 1 0 05 May 2025
A Synergistic Framework of Nonlinear Acoustic Computing and Reinforcement Learning for Real-World Human-Robot Interaction Xiaoliang Chen Xin Yu Le Chang Yunhe Huang Jiashuai He ... Jin Li Likai Lin Ziyu Zeng Xianling Tu Shuyu Zhang 110 1 0 04 May 2025
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding Jiaxi Hu Zuchao Li Mengjia Shen Haojun Ai Sheng Li Jun Zhang 80 0 0 20 Jan 2025
Towards Lightweight and Stable Zero-shot TTS with Self-distilled Representation Disentanglement Qianniu Chen Xiaoyang Hao Yangqiu Song Yunxing Liu Li Lu 79 0 0 15 Jan 2025
Improving non-autoregressive end-to-end speech recognition with pre-trained acoustic and language models Keqi Deng Zehui Yang Shinji Watanabe Yosuke Higuchi Gaofeng Cheng Pengyuan Zhang 59 23 0 25 Jan 2022
An Improved Single Step Non-autoregressive Transformer for Automatic Speech Recognition Ruchao Fan Wei Chu Peng Chang Jing Xiao Abeer Alwan 66 15 0 18 Jun 2021
Non-Autoregressive Transformer ASR with CTC-Enhanced Decoder Input Xingcheng Song Zhiyong Wu Yiheng Huang Chao Weng Dan Su Helen Meng 62 36 0 28 Oct 2020
CASS-NAT: CTC Alignment-based Single Step Non-autoregressive Transformer for Speech Recognition Ruchao Fan Wei Chu Peng Chang Jing Xiao 53 36 0 28 Oct 2020
Universal ASR: Unifying Streaming and Non-Streaming ASR Using a Single Encoder-Decoder Model Zhifu Gao Shiliang Zhang Ming Lei Ian Mcloughlin CVBM 54 15 0 27 Oct 2020
Glancing Transformer for Non-Autoregressive Neural Machine Translation Lihua Qian Hao Zhou Yu Bao Mingxuan Wang Lin Qiu Weinan Zhang Yong Yu Lei Li 108 158 0 18 Aug 2020
Mask CTC: Non-Autoregressive End-to-End ASR with CTC and Mask Predict Yosuke Higuchi Shinji Watanabe Nanxin Chen Tetsuji Ogawa Tetsunori Kobayashi 59 139 0 18 May 2020
Conformer: Convolution-augmented Transformer for Speech Recognition Anmol Gulati James Qin Chung-Cheng Chiu Niki Parmar Yu Zhang ... Wei Han Shibo Wang Zhengdong Zhang Yonghui Wu Ruoming Pang 229 3,164 0 16 May 2020
CIF: Continuous Integrate-and-Fire for End-to-End Speech Recognition Linhao Dong Bo Xu 75 128 0 27 May 2019
AISHELL-2: Transforming Mandarin ASR Research Into Industrial Scale Jiayu Du Xingyu Na Xuechen Liu Hui Bu VLM 64 287 0 31 Aug 2018
ESPnet: End-to-End Speech Processing Toolkit Shinji Watanabe Takaaki Hori Shigeki Karita Tomoki Hayashi Jiro Nishitoba ... Jahn Heymann Sanjeev Khudanpur Nanxin Chen Adithya Renduchintala Tsubasa Ochiai VLM 122 1,515 0 30 Mar 2018
Non-Autoregressive Neural Machine Translation Jiatao Gu James Bradbury Caiming Xiong Victor O.K. Li R. Socher 107 798 0 07 Nov 2017
OpenNMT: Open-Source Toolkit for Neural Machine Translation Guillaume Klein Yoon Kim Yuntian Deng Jean Senellart Alexander M. Rush 338 1,900 0 10 Jan 2017
Listen, Attend and Spell William Chan Navdeep Jaitly Quoc V. Le Oriol Vinyals RALM 165 2,269 0 05 Aug 2015
Speech Recognition with Deep Recurrent Neural Networks Alex Graves Abdel-rahman Mohamed Geoffrey E. Hinton 230 8,529 0 22 Mar 2013