Title
X-Risk Analysis for AI Research Dan Hendrycks Mantas Mazeika 97 71 0 13 Jun 2022
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Rameswar Panda Marc G. Bellemare OffRL OnRL 126 66 0 03 Jun 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 1.2K 13,290 0 04 Mar 2022
Simple and Principled Uncertainty Estimation with Deterministic Deep Learning via Distance Awareness Jeremiah Zhe Liu Zi Lin Shreyas Padhy Dustin Tran Tania Bedrax-Weiss Balaji Lakshminarayanan UQCV BDL 293 453 0 17 Jun 2020