Professor Forcing: A New Algorithm for Training Recurrent Networks

27 October 2016

Aaron Courville

Papers citing "Professor Forcing: A New Algorithm for Training Recurrent Networks"

50 / 293 papers shown

Title
Anomaly Detection in Event-triggered Traffic Time Series via Similarity Learning Shaoyu Dou Kai Yang Yang Jiao Chengbo Qiu Kui Ren AI4TS 14 1 0 20 Jun 2025
KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction Jang-Hyun Kim Jinuk Kim S. Kwon Jae W. Lee Sangdoo Yun Hyun Oh Song MQ VLM 49 0 0 29 May 2025
Low-Resource Neural Machine Translation Using Recurrent Neural Networks and Transfer Learning: A Case Study on English-to-Igbo Ocheme Anthony Ekle Biswarup Das 56 0 0 24 Apr 2025
DiffAD: A Unified Diffusion Modeling Approach for Autonomous Driving Tao Wang Cong Zhang Xingguang Qu Kun Li Wen Liu Chenyu Huang 117 1 0 15 Mar 2025
Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis Kai Qiu Xianrui Li Jason Kuen Hong Chen Xiaohao Xu Jiuxiang Gu Yinyi Luo Bhiksha Raj Zhe Lin Marios Savvides 158 2 0 11 Mar 2025
Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model Mingxing Li Rui Wang Lei Sun Y. Bai Xiangxiang Chu 98 0 0 08 Mar 2025
Unlocking Efficient, Scalable, and Continual Knowledge Editing with Basis-Level Representation Fine-Tuning Tianci Liu R. Li Yunzhe Qi Hui Liu Xianfeng Tang ... Qingyu Yin Monica Cheng Jun Huan Haoyu Wang Jing Gao KELM 98 4 0 01 Mar 2025
Fast and Accurate Blind Flexible Docking Zizhuo Zhang Lijun Wu Kaiyuan Gao Jiangchao Yao Tao Qin Bo Han 88 0 0 20 Feb 2025
From Few to Many: Self-Improving Many-Shot Reasoners Through Iterative Optimization and Generation Xingchen Wan Han Zhou Ruoxi Sun Hootan Nakhost Ke Jiang Sercan Ö. Arık ReLM OffRL LRM 78 4 0 01 Feb 2025
Taming Teacher Forcing for Masked Autoregressive Video Generation Deyu Zhou Quan Sun Yuang Peng Kun Yan Runpei Dong ... Zheng Ge Nan Duan Xiangyu Zhang L. Ni H. Shum VGen 100 9 0 21 Jan 2025
DriveLM: Driving with Graph Visual Question Answering Chonghao Sima Katrin Renz Kashyap Chitta Lawrence Yunliang Chen Hanxue Zhang Chengen Xie Jens Beißwenger Ping Luo Andreas Geiger Hongyang Li 289 207 0 17 Jan 2025
ORID: Organ-Regional Information Driven Framework for Radiology Report Generation Tiancheng Gu Kaicheng Yang Xiang An Ziyong Feng Dongnan Liu Weidong Cai 160 1 0 20 Nov 2024
SeriesGAN: Time Series Generation via Adversarial and Autoregressive Learning MohammadReza EskandariNasab S. M. Hamdi S. F. Boubrahimi GAN AI4TS 70 0 0 28 Oct 2024
Utilizing Image Transforms and Diffusion Models for Generative Modeling of Short and Long Time Series Ilan Naiman Nimrod Berman Itai Pemper Idan Arbiv Gal Fadlon Omri Azencot 87 15 0 25 Oct 2024
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens Zhepeng Cen Yao Liu Siliang Zeng Pratik Chaudhar Huzefa Rangwala George Karypis Rasool Fakoor SyDa AIFin 131 3 0 18 Oct 2024
End-to-end Planner Training for Language Modeling Nathan Cornille Florian Mai Jingyuan Sun Marie-Francine Moens 50 0 0 16 Oct 2024
Extra Global Attention Designation Using Keyword Detection in Sparse Transformer Architectures Evan Lucas Dylan Kangas Timothy C Havens 65 1 0 11 Oct 2024
ChronoGAN: Supervised and Embedded Generative Adversarial Networks for Time Series Generation MohammadReza EskandariNasab S. M. Hamdi S. F. Boubrahimi GAN AI4TS 57 1 0 21 Sep 2024
Inference acceleration for large language models using "stairs" assisted greedy generation Domas Grigaliunas M. Lukoševičius 32 0 0 29 Jul 2024
Hierarchically Disentangled Recurrent Network for Factorizing System Dynamics of Multi-scale Systems: An application on Hydrological Systems Rahul Ghosh Zac McEachran Arvind Renganathan Kelly Lindsay Somya Sharma M. Steinbach John L. Nieber Christopher J. Duffy Vipin Kumar AI4CE BDL 63 0 0 29 Jul 2024
Reinforced Decoder: Towards Training Recurrent Neural Networks for Time Series Forecasting Qi Sima Xinze Zhang Yukun Bao Siyue Yang Liang Shen AI4TS 80 1 0 14 Jun 2024
Defining error accumulation in ML atmospheric simulators R. Parthipan Mohit Anand Hannah M. Christensen J. S. Hosking Damon J. Wischik 29 1 0 23 May 2024
End-to-End Real-World Polyphonic Piano Audio-to-Score Transcription with Hierarchical Decoding Wei Zeng Xian He Ye Wang 34 0 0 22 May 2024
PyramidInfer: Pyramid KV Cache Compression for High-throughput LLM Inference Dongjie Yang Xiaodong Han Yan Gao Yao Hu Shilin Zhang Hai Zhao 102 63 0 21 May 2024
ACEGEN: Reinforcement learning of generative chemical agents for drug discovery Albert Bou Morgan Thomas Sebastian Dittert Carles Navarro Ramírez Maciej Majewski ... Mazen Ahmad Vincent Moens Woody Sherman Simone Sciabola Gianni De Fabritiis 94 9 0 07 May 2024
Efficient Sample-Specific Encoder Perturbations Yassir Fathullah Mark Gales 49 0 0 01 May 2024
Understanding attention-based encoder-decoder networks: a case study with chess scoresheet recognition Sergio Y. Hayashi N. Hirata 89 0 0 23 Apr 2024
Sentence-Level or Token-Level? A Comprehensive Study on Knowledge Distillation Jingxuan Wei Linzhuang Sun Yichong Leng Xu Tan Bihui Yu Ruifeng Guo 90 4 0 23 Apr 2024
MASSM: An End-to-End Deep Learning Framework for Multi-Anatomy Statistical Shape Modeling Directly From Images Janmesh Ukey Tushar Kataria Shireen Y. Elhabian MedIm 81 1 0 16 Mar 2024
The pitfalls of next-token prediction Gregor Bachmann Vaishnavh Nagarajan 113 81 0 11 Mar 2024
Neural Exec: Learning (and Learning from) Execution Triggers for Prompt Injection Attacks Dario Pasquini Martin Strohmeier Carmela Troncoso AAML 112 28 0 06 Mar 2024
Neural machine translation of clinical procedure codes for medical diagnosis and uncertainty quantification Pei-Hung Chung Shuhan He Norawit Kijpaisalratana Abdel-badih el Ariss Byung-Jun Yoon 59 0 0 07 Feb 2024
DySLIM: Dynamics Stable Learning by Invariant Measure for Chaotic Systems Yair Schiff Zhong Yi Wan Jeffrey B. Parker Stephan Hoyer Volodymyr Kuleshov Fei Sha Leonardo Zepeda-Núñez 137 15 0 06 Feb 2024
A Multi-step Loss Function for Robust Learning of the Dynamics in Model-based Reinforcement Learning Abdelhakim Benechehab Albert Thomas Giuseppe Paolo Maurizio Filippone Balázs Kégl NoLa 47 1 0 05 Feb 2024
SutraNets: Sub-series Autoregressive Networks for Long-Sequence, Probabilistic Forecasting Shane Bergsma Timothy J. Zeyl Lei Guo AI4TS 96 3 0 22 Dec 2023
DSS: Synthesizing long Digital Ink using Data augmentation, Style encoding and Split generation A. Timofeev Anastasiia Fadeeva A. Afonin C. Musat Andrii Maksai 136 2 0 29 Nov 2023
Multilingual Mathematical Autoformalization Albert Q. Jiang Wenda Li M. Jamnik AI4CE 135 22 0 07 Nov 2023
Time-series Generation by Contrastive Imitation Daniel Jarrett Ioana Bica M. Schaar AI4TS 82 24 0 02 Nov 2023
Multi-Path Long-Term Vessel Trajectories Forecasting with Probabilistic Feature Fusion for Problem Shifting Gabriel Spadon Jay Kumar Derek Eden Josh van Berkel Tom Foster Amilcar Soares Ronan Fablet Stan Matwin Ronald Pelot 82 6 0 29 Oct 2023
Kernel-Elastic Autoencoder for Molecular Design Haote Li Yu Shee B. Allen F. Maschietto Victor S. Batista 71 7 0 12 Oct 2023
FABind: Fast and Accurate Protein-Ligand Binding Qizhi Pei Kaiyuan Gao Lijun Wu Jinhua Zhu Yingce Xia Shufang Xie Tao Qin Kun He Tie-Yan Liu Rui Yan 127 21 0 10 Oct 2023
Generative Modeling of Regular and Irregular Time Series Data via Koopman VAEs Ilan Naiman N. Benjamin Erichson Pu Ren Lbnl Michael W. Mahoney ICSI Omri Azencot AI4TS 90 26 0 04 Oct 2023
Towards Green AI in Fine-tuning Large Language Models via Adaptive Backpropagation Kai Huang Hanyu Yin Heng Huang Wei Gao 88 11 0 22 Sep 2023
Quantitative Analysis of Forecasting Models:In the Aspect of Online Political Bias S. Tripuraneni Sadia Kamal A. Bagavathi 29 1 0 11 Sep 2023
Fully Embedded Time-Series Generative Adversarial Networks Joe Beck S. Chakraborty GAN TTA AI4TS 49 2 0 30 Aug 2023
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining Haohe Liu Yiitan Yuan Xubo Liu Xinhao Mei Qiuqiang Kong Qiao Tian Yuping Wang Wenwu Wang Yuxuan Wang Mark D. Plumbley DiffM 130 246 0 10 Aug 2023
Bird's-Eye-View Scene Graph for Vision-Language Navigation Ruitao Liu Xiaohan Wang Wenguan Wang Yi Yang 116 57 0 09 Aug 2023
Scaling Data Generation in Vision-and-Language Navigation Zun Wang Jialu Li Yicong Hong Yi Wang Qi Wu Joey Tianyi Zhou Stephen Gould Hao Tan Yu Qiao LM&Ro 104 61 0 28 Jul 2023
Adversarial Conversational Shaping for Intelligent Agents Piotr Tarasiewicz Sultan Kenjeyev Ilana Sebag Shehab Alshehabi GAN 57 0 0 20 Jul 2023
On the Constrained Time-Series Generation Problem Andrea Coletta Sriram Gopalakrishnan Daniel Borrajo Svitlana Vyetrenko DiffM AI4TS 101 40 0 04 Jul 2023