End-to-End Automatic Speech Translation of Audiobooks

12 February 2018

Olivier Pietquin

Papers citing "End-to-End Automatic Speech Translation of Audiobooks"

50 / 123 papers shown

Title
HENT-SRT: Hierarchical Efficient Neural Transducer with Self-Distillation for Joint Speech Recognition and Translation A. Hussein Cihan Xiao Matthew Wiesner Dan Povey Leibny Paola García Sanjeev Khudanpur 24 0 0 02 Jun 2025
AdaST: Dynamically Adapting Encoder States in the Decoder for End-to-End Speech-to-Text Translation Wuwei Huang Dexin Wang Deyi Xiong 89 4 0 18 Mar 2025
Joint Training And Decoding for Multilingual End-to-End Simultaneous Speech Translation Wuwei Huang Renren Jin Wen Zhang Jian Luan Bin Wang Deyi Xiong 102 1 0 14 Mar 2025
Prepending or Cross-Attention for Speech-to-Text? An Empirical Comparison Tsz Kin Lam Marco Gaido Sara Papi L. Bentivogli Barry Haddow 128 0 0 04 Jan 2025
Unveiling the Role of Pretraining in Direct Speech Translation Belen Alastruey Gerard I. Gállego Marta R. Costa-jussá 71 0 0 26 Sep 2024
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs Keyu An Qian Chen Chong Deng Zhihao Du Changfeng Gao ... Bin Zhang Qinglin Zhang Shiliang Zhang Nan Zhao Siqi Zheng AuLLM 139 57 0 04 Jul 2024
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving Bhavani Shankar Preethi Jyothi Pushpak Bhattacharyya 90 1 0 16 Jun 2024
Soft Language Identification for Language-Agnostic Many-to-One End-to-End Speech Translation Peidong Wang Jian Xue Jinyu Li Junkun Chen Aswin Shanmugam Subramanian 85 0 0 12 Jun 2024
How do Hyenas deal with Human Speech? Speech Recognition and Translation with ConfHyena Marco Gaido Sara Papi Matteo Negri L. Bentivogli 100 1 0 20 Feb 2024
Pushing the Limits of Zero-shot End-to-End Speech Translation Ioannis Tsiamas Gerard I. Gállego José A. R. Fonollosa Marta R. Costa-jussá 97 10 0 16 Feb 2024
Efficient Monotonic Multihead Attention Xutai Ma Anna Y. Sun Siqi Ouyang Hirofumi Inaguma Paden Tomasello 65 4 0 07 Dec 2023
End-to-End Speech-to-Text Translation: A Survey Nivedita Sethiya Chandresh Kumar Maurya 110 8 0 02 Dec 2023
Tuning Large language model for End-to-end Speech Translation Hao Zhang Nianwen Si Yaqi Chen Wenlin Zhang Xu Yang Dan Qu Xiaolin Jiao 92 8 0 03 Oct 2023
Enhancing End-to-End Conversational Speech Translation Through Target Language Context Utilization A. Hussein Brian Yan Antonios Anastasopoulos Shinji Watanabe Sanjeev Khudanpur 83 7 0 27 Sep 2023
Improving End-to-End Speech Translation by Imitation-Based Knowledge Distillation with Synthetic Transcripts Rebekka Hubert Artem Sokolov Stefan Riezler 56 1 0 17 Jul 2023
Transfer Learning from Pre-trained Language Models Improves End-to-End Speech Summarization Kohei Matsuura Takanori Ashihara Takafumi Moriya Tomohiro Tanaka Takatomo Kano A. Ogawa Marc Delcroix 61 8 0 07 Jun 2023
Speech Translation with Foundation Models and Optimal Transport: UPC at IWSLT23 Ioannis Tsiamas Gerard I. Gállego José A. R. Fonollosa Marta R. Costa-jussá OT 45 3 0 02 Jun 2023
Bridging the Granularity Gap for Acoustic Modeling Chen Xu Yuhao Zhang Chengbo Jiao Xiaoqian Liu Chi Hu Xin Zeng Tong Xiao Anxiang Ma Huizhen Wang JingBo Zhu 61 6 0 27 May 2023
Improving speech translation by fusing speech and text Wenbiao Yin Zhicheng Liu Chengqi Zhao Tao Wang Jian-Fei Tong Rong Ye 56 4 0 23 May 2023
A unified front-end framework for English text-to-speech synthesis Zelin Ying Chen Li Yuming Dong Qiuqiang Kong Yuping Wang Yuanyuan Huo Yuxuan Wang 84 5 0 18 May 2023
Improving Speech Translation by Cross-Modal Multi-Grained Contrastive Learning Hao Zhang Nianwen Si Yaqi Chen Wenlin Zhang Xukui Yang Dan Qu Weiqiang Zhang 81 10 0 20 Apr 2023
Decouple Non-parametric Knowledge Distillation For End-to-end Speech Translation Hao Zhang Nianwen Si Yaqi Chen Wenlin Zhang Xukui Yang Dan Qu Zhen Li 52 4 0 20 Apr 2023
Transformers in Speech Processing: A Survey S. Latif Aun Zaidi Heriberto Cuayáhuitl Fahad Shamshad Moazzam Shoukat Muhammad Usama Junaid Qadir 167 48 0 21 Mar 2023
Pre-training for Speech Translation: CTC Meets Optimal Transport Hang Le Hongyu Gong Changhan Wang J. Pino Benjamin Lecouteux D. Schwab OT 100 26 0 27 Jan 2023
WACO: Word-Aligned Contrastive Learning for Speech Translation Siqi Ouyang Rong Ye Lei Li 104 28 0 19 Dec 2022
AdaTranS: Adapting with Boundary-based Shrinking for End-to-End Speech Translation Xingshan Zeng Liangyou Li Qun Liu 59 5 0 17 Dec 2022
UnitY: Two-pass Direct Speech-to-speech Translation with Discrete Units Hirofumi Inaguma Sravya Popuri Ilia Kulikov Peng-Jen Chen Changhan Wang Yu-An Chung Yun Tang Ann Lee Shinji Watanabe J. Pino 119 61 0 15 Dec 2022
Improving End-to-end Speech Translation by Leveraging Auxiliary Speech and Text Data Yuhao Zhang Chen Xu Bojie Hu Chunliang Zhang Tong Xiao Jingbo Zhu 66 16 0 04 Dec 2022
Efficient Speech Translation with Pre-trained Models Zhaolin Li Jan Niehues 54 2 0 09 Nov 2022
Does Joint Training Really Help Cascaded Speech Translation? Viet Anh Khoa Tran David Thulke Yingbo Gao Christian Herold Hermann Ney 72 4 0 24 Oct 2022
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation Chen Wang Yuchen Liu Boxing Chen Jiajun Zhang Wei Luo Zhongqiang Huang Chengqing Zong 64 10 0 18 Oct 2022
YFACC: A Yorùbá speech-image dataset for cross-lingual keyword localisation through visual grounding Kayode Olaleye Dan Oneaţă Herman Kamper ObjD 78 8 0 10 Oct 2022
Direct Speech Translation for Automatic Subtitling Sara Papi Marco Gaido Alina Karakanta Mauro Cettolo Matteo Negri Marco Turchi 102 11 0 27 Sep 2022
Multitask Learning from Augmented Auxiliary Data for Improving Speech Emotion Recognition S. Latif R. Rana Sara Khalifa Raja Jurdak Björn W. Schuller 72 23 0 12 Jul 2022
Multiformer: A Head-Configurable Transformer-Based Model for Direct Speech Translation Gerard Sant Gerard I. Gállego Belen Alastruey Marta R. Costa-jussá 59 4 0 14 May 2022
Cross-modal Contrastive Learning for Speech Translation Rong Ye Mingxuan Wang Lei Li SSL 94 91 0 05 May 2022
On the Locality of Attention in Direct Speech Translation Belen Alastruey Javier Ferrando Gerard I. Gállego Marta R. Costa-jussá 60 8 0 19 Apr 2022
Self Supervised Adversarial Domain Adaptation for Cross-Corpus and Cross-Language Speech Emotion Recognition S. Latif R. Rana Sara Khalifa Raja Jurdak Björn Schuller 109 50 0 19 Apr 2022
Large-Scale Streaming End-to-End Speech Translation with Neural Transducers Jian Xue Peidong Wang Jinyu Li Matt Post Yashesh Gaur AI4TS 72 31 0 11 Apr 2022
Enhanced Direct Speech-to-Speech Translation Using Self-supervised Pre-training and Data Augmentation Sravya Popuri Peng-Jen Chen Changhan Wang J. Pino Yossi Adi Jiatao Gu Wei-Ning Hsu Ann Lee 142 58 0 06 Apr 2022
Leveraging unsupervised and weakly-supervised data to improve direct speech-to-speech translation Ye Jia Yifan Ding Ankur Bapna Colin Cherry Yu Zhang Alexis Conneau Nobuyuki Morioka 94 21 0 24 Mar 2022
STEMM: Self-learning with Speech-text Manifold Mixup for Speech Translation Qingkai Fang Rong Ye Lei Li Yang Feng Mingxuan Wang 122 100 0 20 Mar 2022
Prabhupadavani: A Code-mixed Speech Translation Data for 25 Languages Jivnesh Sandhan Ayush Daksh Om Adideva Paranjay Laxmidhar Behera Pawan Goyal 30 8 0 27 Jan 2022
A Unified Speaker Adaptation Approach for ASR Yingzhu Zhao Chongjia Ni C. Leung Shafiq Joty Chng Eng Siong B. Ma CLL 112 9 0 16 Oct 2021
Decision Attentive Regularization to Improve Simultaneous Speech Translation Systems Mohd Abbas Zaidi Beomseok Lee Sangha Kim Chanwoo Kim 66 5 0 13 Oct 2021
Fast-MD: Fast Multi-Decoder End-to-End Speech Translation with Non-Autoregressive Hidden Intermediates Hirofumi Inaguma Siddharth Dalmia Brian Yan Shinji Watanabe 99 11 0 27 Sep 2021
Learning When to Translate for Streaming Speech Qianqian Dong Yaoming Zhu Mingxuan Wang Lei Li 100 30 0 15 Sep 2021
Speechformer: Reducing Information Loss in Direct Speech Translation Sara Papi Marco Gaido Matteo Negri Marco Turchi 129 24 0 09 Sep 2021
Non-autoregressive End-to-end Speech Translation with Parallel Autoregressive Rescoring Hirofumi Inaguma Yosuke Higuchi Kevin Duh Tatsuya Kawahara Shinji Watanabe 87 11 0 09 Sep 2021
Efficient Transformer for Direct Speech Translation Belen Alastruey Gerard I. Gállego Marta R. Costa-jussá 54 7 0 07 Jul 2021