An Alternative Softmax Operator for Reinforcement Learning

16 December 2016

Michael L. Littman

Papers citing "An Alternative Softmax Operator for Reinforcement Learning"

3 / 3 papers shown

Title
Bridging the Gap Between Value and Policy Based Reinforcement Learning Ofir Nachum Mohammad Norouzi Kelvin Xu Dale Schuurmans 174 476 0 28 Feb 2017
Algorithms for multi-armed bandit problems Volodymyr Kuleshov Doina Precup 150 351 0 25 Feb 2014
Apprenticeship Learning using Inverse Reinforcement Learning and Gradient Methods Gergely Neu Csaba Szepesvári 84 243 0 20 Jun 2012