Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation

14 June 2021

Papers citing "Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation"

19 / 19 papers shown

Title
Unveiling Attractor Cycles in Large Language Models: A Dynamical Systems View of Successive Paraphrasing Zhilin Wang Yafu Li Jianhao Yan Yu Cheng Yue Zhang 65 0 0 21 Feb 2025
From Self-Attention to Markov Models: Unveiling the Dynamics of Generative Transformers M. E. Ildiz Yixiao Huang Yingcong Li A. S. Rawat Samet Oymak 35 17 0 21 Feb 2024
Exploring Automatic Text Simplification of German Narrative Documents T. Schomacker Tillmann Dönicke Marina Tropmann-Frick 22 2 0 15 Dec 2023
InferDPT: Privacy-Preserving Inference for Black-box Large Language Model Meng Tong Kejiang Chen Jie Zhang Yuang Qi Weiming Zhang Neng H. Yu Tianwei Zhang Zhikun Zhang SILM 30 2 0 18 Oct 2023
Repetition In Repetition Out: Towards Understanding Neural Text Degeneration from the Data Perspective Huayang Li Tian Lan Z. Fu Deng Cai Lemao Liu Nigel Collier Taro Watanabe Yixuan Su 34 11 0 16 Oct 2023
Multi-level Adaptive Contrastive Learning for Knowledge Internalization in Dialogue Generation Chenxu Yang Zheng Lin Lanrui Wang Chong Tian Liang Pang JiangNan Li Qirong Ho Yanan Cao Weiping Wang 24 1 0 13 Oct 2023
Language Model Decoding as Direct Metrics Optimization Haozhe Ji Pei Ke Hongning Wang Minlie Huang 11 7 0 02 Oct 2023
Error Norm Truncation: Robust Training in the Presence of Data Noise for Text Generation Models Tianjian Li Haoran Xu Philipp Koehn Daniel Khashabi Kenton W. Murray 36 4 0 02 Oct 2023
Understanding In-Context Learning from Repetitions Jianhao Yan Jin Xu Chiyu Song Chenming Wu Yafu Li Yue Zhang 22 20 0 30 Sep 2023
Mitigating the Learning Bias towards Repetition by Self-Contrastive Training for Open-Ended Generation Jian-Yu Guan Minlie Huang 26 0 0 04 Jul 2023
Decouple Non-parametric Knowledge Distillation For End-to-end Speech Translation Hao Zhang Nianwen Si Yaqi Chen Wenlin Zhang Xukui Yang Dan Qu Zhen Li 19 3 0 20 Apr 2023
Dynamic Scheduled Sampling with Imitation Loss for Neural Text Generation Xiang Lin Prathyusha Jwalapuram Shafiq R. Joty DiffM 18 0 0 31 Jan 2023
Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation Jin Xu Xiaojiang Liu Jianhao Yan Deng Cai Huayang Li Jian Li 25 70 0 06 Jun 2022
R2D2: Robust Data-to-Text with Replacement Detection Linyong Nan Lorenzo Jaime Yu Flores Yilun Zhao Yixin Liu Luke Benson Weijin Zou Dragomir R. Radev 37 17 0 25 May 2022
Nearest Neighbor Knowledge Distillation for Neural Machine Translation Zhixian Yang Renliang Sun Xiaojun Wan 13 12 0 01 May 2022
SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization Mathieu Ravaut Shafiq R. Joty Nancy F. Chen MoE 16 91 0 13 Mar 2022
Text Summarization with Pretrained Encoders Yang Liu Mirella Lapata MILM 258 1,431 0 22 Aug 2019
Six Challenges for Neural Machine Translation Philipp Koehn Rebecca Knowles AAML AIMat 215 1,207 0 12 Jun 2017
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Z. Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 716 6,743 0 26 Sep 2016