I3D: Transformer architectures with input-dependent dynamic depth for speech recognition

14 March 2023

Papers citing "I3D: Transformer architectures with input-dependent dynamic depth for speech recognition"

10 / 10 papers shown

Title
Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making Francesco Iodice Elena De Momi Arash Ajoudani 48 0 0 10 Mar 2025
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification Yifan Peng Yui Sudo Muhammad Shakeel Shinji Watanabe VLM 35 17 0 20 Feb 2024
OWSM v3.1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer Yifan Peng Jinchuan Tian William Chen Siddhant Arora Brian Yan ... Kwanghee Choi Jiatong Shi Xuankai Chang Jee-weon Jung Shinji Watanabe VLM OSLM 26 40 0 30 Jan 2024
CTC Blank Triggered Dynamic Layer-Skipping for Efficient CTC-based Speech Recognition Junfeng Hou Peiyao Wang Jincheng Zhang Meng-Da Yang Minwei Feng Jingcheng Yin 27 1 0 04 Jan 2024
Reproducing Whisper-Style Training Using an Open-Source Toolkit and Publicly Available Data Yifan Peng Jinchuan Tian Brian Yan Dan Berrebbi Xuankai Chang ... Yui Sudo Muhammad Shakeel Jee-weon Jung Soumi Maiti Shinji Watanabe VLM 31 35 0 25 Sep 2023
CoLLD: Contrastive Layer-to-layer Distillation for Compressing Multilingual Pre-trained Speech Encoders Heng-Jui Chang Ning Dong Ruslan Mavlyutov Sravya Popuri Yu-An Chung 40 6 0 14 Sep 2023
Improving vision-inspired keyword spotting using dynamic module skipping in streaming conformer encoder Alexandre Bittar Paul Dixon Mohammad Samragh K. Nishu Devang Naik 17 3 0 31 Aug 2023
E-Branchformer: Branchformer with Enhanced merging for speech recognition Kwangyoun Kim Felix Wu Yifan Peng Jing Pan Prashant Sridhar Kyu Jeong Han Shinji Watanabe 50 105 0 30 Sep 2022
Dual-Encoder Architecture with Encoder Selection for Joint Close-Talk and Far-Talk Speech Recognition F. Weninger M. Gaudesi Ralf Leibold R. Gemello P. Zhan 21 4 0 17 Sep 2021
Intermediate Loss Regularization for CTC-based Speech Recognition Jaesong Lee Shinji Watanabe 113 135 0 05 Feb 2021