v1v2v3v4v5 (latest)

Neural Machine Translation of Rare Words with Subword Units

31 August 2015

Papers citing "Neural Machine Translation of Rare Words with Subword Units"

50 / 101 papers shown

Title
Multimodal Machine Translation with Visual Scene Graph Pruning Chenyu Lu Shiliang Sun Jing Zhao N. Zhang Tengfei Song Hao Yang 225 0 0 26 May 2025
LLM-Based Emulation of the Radio Resource Control Layer: Towards AI-Native RAN Protocols Ziming Liu Bryan Liu Alvaro Valcarce Xiaoli Chu 242 1 0 22 May 2025
Illusion or Algorithm? Investigating Memorization, Emergence, and Symbolic Processing in In-Context Learning Jingcheng Niu Subhabrata Dutta Ahmed Elshabrawy Harish Tayyar Madabushi Iryna Gurevych 135 1 0 16 May 2025
GIF: Generative Inspiration for Face Recognition at Scale Saeed Ebrahimi Sahar Rahimi Ali Dabouei Srinjoy Das Jeremy M. Dawson Nasser M. Nasrabadi CVBM 525 0 0 05 May 2025
Data Augmentation With Back translation for Low Resource languages: A case of English and Luganda Richard Kimera DongNyeong Heo Daniela N. Rim Heeyoul Choi 446 0 0 05 May 2025
Adaptive Token Boundaries: Integrating Human Chunking Mechanisms into Multimodal LLMs Dongxing Yu 117 0 0 03 May 2025
Mixture of Sparse Attention: Content-Based Learnable Sparse Attention via Expert-Choice Routing Piotr Piekos Róbert Csordás Jürgen Schmidhuber MoE VLM 245 2 0 01 May 2025
TASTE: Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling Liang-Hsuan Tseng Yi-Chang Chen Kuan-Yi Lee Da-shan Shiu Hung-yi Lee AuLLM 149 0 0 09 Apr 2025
Self-Vocabularizing Training for Neural Machine Translation Pin-Jie Lin Ernie Chang Yangyang Shi Vikas Chandra 118 0 0 18 Mar 2025
SuperBPE: Space Travel for Language Models Alisa Liu J. Hayase Valentin Hofmann Sewoong Oh Noah A. Smith Yejin Choi 147 10 0 17 Mar 2025
The Box is in the Pen: Evaluating Commonsense Reasoning in Neural Machine Translation Jie He Tao Wang Deyi Xiong Qun Liu ELM LRM 183 32 0 05 Mar 2025
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter Yepeng Weng Dianwen Mei Huishi Qiu Xujie Chen Li Liu Jiang Tian Zhongchao Shi 163 0 0 24 Feb 2025
Can ChatGPT Learn to Count Letters? Javier Conde Gonzalo Martínez Pedro Reviriego Zhen Gao Shanshan Liu Fabrizio Lombardi 97 1 0 23 Feb 2025
UniASM: Binary Code Similarity Detection without Fine-tuning Yeming Gu Hui Shu Fei Kang Fan Hu 202 10 0 21 Feb 2025
Deterministic Reversible Data Augmentation for Neural Machine Translation Jiashu Yao Heyan Huang Zeming Liu Yuhang Guo 165 0 0 21 Feb 2025
CR-CTC: Consistency regularization on CTC for improved speech recognition Zengwei Yao Wei Kang Xiaoyu Yang Fangjun Kuang Liyong Guo Han Zhu Zengrui Jin Zhaoqing Li Long Lin Daniel Povey 121 4 0 17 Feb 2025
MassSpecGym: A benchmark for the discovery and identification of molecules Roman Bushuiev Anton Bushuiev Niek F. de Jonge A. Young Fleming Kretschmer ... Justin J. J. van der Hooft Michael A. Stravs Sebastian Böcker Josef Sivic Tomáš Pluskal 146 6 0 17 Feb 2025
TituLLMs: A Family of Bangla LLMs with Comprehensive Benchmarking Shahriar Kabir Nahin R. N. Nandi Sagor Sarker Quazi Sarwar Muhtaseem Md. Kowsher Apu Chandraw Shill Md Ibrahim Mehadi Hasan Menon Tareq Al Muntasir Firoj Alam 180 0 0 16 Feb 2025
LOB-Bench: Benchmarking Generative AI for Finance -- an Application to Limit Order Book Data Peer Nagy Sascha Frey Kang Li Bidipta Sarkar Svitlana Vyetrenko Stefan Zohren Ani Calinescu Jakob Foerster 173 1 0 13 Feb 2025
Enhancing LLM Character-Level Manipulation via Divide and Conquer Zhen Xiong Yujun Cai Bryan Hooi Nanyun Peng Kai-Wei Chang Zhecheng Li 149 0 0 12 Feb 2025
Vision-centric Token Compression in Large Language Model Ling Xing Alex Jinpeng Wang Rui Yan Xiangbo Shu Jinhui Tang VLM 130 0 0 02 Feb 2025
PixelWorld: Towards Perceiving Everything as Pixels Zhiheng Lyu Xueguang Ma Wenhu Chen 245 1 0 31 Jan 2025
Weight-based Analysis of Detokenization in Language Models: Understanding the First Stage of Inference Without Inference Go Kamoda Benjamin Heinzerling Tatsuro Inaba Keito Kudo Keisuke Sakaguchi Kentaro Inui MILM 119 3 0 27 Jan 2025
Banzhaf Power in Hierarchical Voting Games John Randolph Denizalp Goktas Amy Greenwald 70 0 0 12 Jan 2025
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs Sheng Zhang Yanbo Xu Naoto Usuyama Hanwen Xu J. Bagga ... Carlo Bifulco M. Lungren Tristan Naumann Sheng Wang Hoifung Poon LM&MA MedIm 233 233 0 10 Jan 2025
Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition Rui Liu Hongyu Yuan Hong Li 114 0 0 03 Jan 2025
Enhancing Visual Representation for Text-based Person Searching Wei Shen Ming Fang Yuxia Wang Jiafeng Xiao Diping Li Ningyu Zhang Ling Xu Weinan Zhang 104 1 0 31 Dec 2024
DP-2Stage: Adapting Language Models as Differentially Private Tabular Data Generators Tejumade Afonja Hui-Po Wang Raouf Kerkouche Mario Fritz SyDa 194 2 0 03 Dec 2024
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning Zhu Xu Zhiqiang Zhao Zihan Zhang Yuchi Liu Quanwei Shen Fei Liu Yu Kuang Jian He Conglin Liu 163 2 0 26 Nov 2024
Bag of Design Choices for Inference of High-Resolution Masked Generative Transformer Shitong Shao Zikai Zhou Tian Ye Lichen Bai Zhiqiang Xu Zeke Xie DiffM 114 0 0 16 Nov 2024
HeartBERT: A Self-Supervised ECG Embedding Model for Efficient and Effective Medical Signal Analysis Saedeh Tahery Fatemeh Hamid Akhlaghi Termeh Amirsoleimani OOD 139 1 0 08 Nov 2024
CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM Jingwei Xu Chenyu Wang Zibo Zhao Wen Liu Yi-An Ma Shenghua Gao 121 18 0 07 Nov 2024
SPES: Spectrogram Perturbation for Explainable Speech-to-Text Generation Dennis Fucci Marco Gaido Beatrice Savoldi Matteo Negri Mauro Cettolo L. Bentivogli 257 3 0 03 Nov 2024
MoCE: Adaptive Mixture of Contextualization Experts for Byte-based Neural Machine Translation Langlin Huang Mengyu Bu Yang Feng 95 0 0 03 Nov 2024
MultiTok: Variable-Length Tokenization for Efficient LLMs Adapted from LZW Compression Noel Elias H. Esfahanizadeh Kaan Kale S. Vishwanath Muriel Médard 107 0 0 28 Oct 2024
MrT5: Dynamic Token Merging for Efficient Byte-level Language Models Julie Kallini Shikhar Murty Christopher D. Manning Christopher Potts Róbert Csordás 86 4 0 28 Oct 2024
LLM The Genius Paradox: A Linguistic and Math Expert's Struggle with Simple Word-based Counting Problems Nan Xu Xuezhe Ma LRM 145 5 0 18 Oct 2024
Evaluating Morphological Compositional Generalization in Large Language Models Mete Ismayilzada Yuan Chiang Jonne Sälevä Hale Sirin Abdullatif Köksal Bhuwan Dhingra Antoine Bosselut Lonneke van der Plas Duygu Ataman 93 5 0 16 Oct 2024
Latent Action Pretraining from Videos Seonghyeon Ye Joel Jang Byeongguk Jeon Sejune Joo Jianwei Yang ... Kimin Lee J. Gao Luke Zettlemoyer Dieter Fox Minjoon Seo 141 45 0 15 Oct 2024
An Annotated Dataset of Errors in Premodern Greek and Baselines for Detecting Them Creston Brooks J. Haubold Charlie Cowen-Breen Jay White Desmond DeVaul Frederick Riemenschneider Karthik Narasimhan B. Graziosi 117 0 0 14 Oct 2024
4-LEGS: 4D Language Embedded Gaussian Splatting Gal Fiebelman Tamir Cohen Ayellet Morgenstern Peter Hedman Hadar Averbuch-Elor 3DGS 121 1 0 14 Oct 2024
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions Yekun Chai Haoran Sun Huang Fang Shuohuan Wang Yu Sun Hua Wu 465 4 0 03 Oct 2024
From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities Wanpeng Zhang Zilong Xie Yicheng Feng Yijiang Li Xingrun Xing Sipeng Zheng Zongqing Lu MLLM 98 1 0 03 Oct 2024
The Conformer Encoder May Reverse the Time Dimension Robin Schmitt Albert Zeyer Mohammad Zeineldeen Ralf Schluter Hermann Ney 78 0 0 01 Oct 2024
Task-Adaptive Pretrained Language Models via Clustered-Importance Sampling David Grangier Simin Fan Skyler Seto Pierre Ablin 203 5 0 30 Sep 2024
Characterizing and Efficiently Accelerating Multimodal Generation Model Inference Yejin Lee Anna Y. Sun Basil Hosmer Bilge Acun Can Balioglu ... Ram Pasunuru Scott Yih Sravya Popuri Xing Liu Carole-Jean Wu 148 2 0 30 Sep 2024
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models Hui-Po Wang Mario Fritz 113 4 0 26 Sep 2024
Smirk: An Atomically Complete Tokenizer for Molecular Foundation Models Alexius Wadell Anoushka Bhutani Venkatasubramanian Viswanathan 465 1 0 19 Sep 2024
DocMamba: Efficient Document Pre-training with State Space Model Pengfei Hu Zhenrong Zhang Jiefeng Ma Shuhang Liu Jun Du Jianshu Zhang Mamba 94 1 0 18 Sep 2024
MAPLE: Enhancing Review Generation with Multi-Aspect Prompt LEarning in Explainable Recommendation Ching-Wen Yang Zhi-Quan Feng Ying-Jia Lin Che-Wei Chen Kun-da Wu Hao Xu Jui-Feng Yao Hung-Yu Kao LRM VLM 103 0 0 19 Aug 2024