v1v2v3 (latest)

Learning to summarize from human feedback

2 September 2020

Papers citing "Learning to summarize from human feedback"

50 / 1,548 papers shown

Title
Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models Zhengxin Zhang Dan Zhao Xupeng Miao Gabriele Oliaro Qing Li Yong Jiang Zhihao Jia MQ 90 9 0 13 Jan 2024
Secrets of RLHF in Large Language Models Part II: Reward Modeling Bing Wang Rui Zheng Luyao Chen Yan Liu Shihan Dou ... Qi Zhang Xipeng Qiu Xuanjing Huang Zuxuan Wu Yuanyuan Jiang ALM 113 110 0 11 Jan 2024
Agent Alignment in Evolving Social Norms Shimin Li Tianxiang Sun Qinyuan Cheng Xipeng Qiu LLMAG 81 8 0 09 Jan 2024
TechGPT-2.0: A large language model project to solve the task of knowledge graph construction Jiaqi Wang Yuying Chang Zhong Li Ning An Qi Ma Lei Hei Haibo Luo Yifei Lu Feiliang Ren 43 6 0 09 Jan 2024
A Minimaximalist Approach to Reinforcement Learning from Human Feedback Gokul Swamy Christoph Dann Rahul Kidambi Zhiwei Steven Wu Alekh Agarwal OffRL 132 112 0 08 Jan 2024
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks Chen Yang Peng Liang Zinan Ma 45 0 0 08 Jan 2024
MLLM-Protector: Ensuring MLLM's Safety without Hurting Performance Renjie Pi Tianyang Han Jianshu Zhang Yueqi Xie Boyao Wang Qing Lian Hanze Dong Jipeng Zhang Tong Zhang AAML 111 71 0 05 Jan 2024
Hyperparameter-Free Approach for Faster Minimum Bayes Risk Decoding Yuu Jinnai Kaito Ariu 101 10 0 05 Jan 2024
Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM Xiaoding Lu Zongyi Liu Adian Liusie Vyas Raina Vineet Mudupalli Yuwen Zhang W. Beauchamp 70 20 0 04 Jan 2024
ICE-GRT: Instruction Context Enhancement by Generative Reinforcement based Transformers Chen Zheng Ke Sun Da Tang Yukun Ma Yuyu Zhang Chenguang Xi Xun Zhou LRM LLMAG 81 2 0 04 Jan 2024
A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity Andrew Lee Xiaoyan Bai Itamar Pres Martin Wattenberg Jonathan K. Kummerfeld Rada Mihalcea 150 121 0 03 Jan 2024
Theoretical guarantees on the best-of-n alignment policy Ahmad Beirami Alekh Agarwal Jonathan Berant Alex DÁmour Jacob Eisenstein Chirag Nagpal A. Suresh 129 61 0 03 Jan 2024
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models Zixiang Chen Yihe Deng Huizhuo Yuan Kaixuan Ji Quanquan Gu SyDa 145 327 0 02 Jan 2024
Uncertainty-Penalized Reinforcement Learning from Human Feedback with Diverse Reward LoRA Ensembles Yuanzhao Zhai Han Zhang Yu Lei Yue Yu Kele Xu Dawei Feng Bo Ding Huaimin Wang AI4CE 147 35 0 30 Dec 2023
Is Knowledge All Large Language Models Needed for Causal Reasoning? Hengrui Cai Shengjie Liu Rui Song LRM ELM 141 13 0 30 Dec 2023
Olapa-MCoT: Enhancing the Chinese Mathematical Reasoning Capability of LLMs Shaojie Zhu Zhaobin Wang Chengxiang Zhuo Hui Lu Bo Hu Zang Li LRM 47 0 0 29 Dec 2023
How Far Are LLMs from Believable AI? A Benchmark for Evaluating the Believability of Human Behavior Simulation Yang Xiao Yi Cheng Jinlan Fu Jiashuo Wang Wenjie Li Pengfei Liu LLMAG 107 5 0 28 Dec 2023
LLM4EDA: Emerging Progress in Large Language Models for Electronic Design Automation Ruizhe Zhong Xingbo Du Shixiong Kai Zhentao Tang Siyuan Xu Hui-Ling Zhen Jianye Hao Qiang Xu Mingxuan Yuan Junchi Yan 73 40 0 28 Dec 2023
Rethinking Tabular Data Understanding with Large Language Models Tianyang Liu Fei Wang Muhao Chen ReLM LMTD LRM 88 19 0 27 Dec 2023
Some things are more CRINGE than others: Iterative Preference Optimization with the Pairwise Cringe Loss Jing Xu Andrew Lee Sainbayar Sukhbaatar Jason Weston 80 97 0 27 Dec 2023
Adapting Large Language Models for Education: Foundational Capabilities, Potentials, and Challenges Qingyao Li Lingyue Fu Weiming Zhang Xianyu Chen Jingwei Yu Wei Xia Weinan Zhang Ruiming Tang Yong Yu AI4Ed ELM 146 24 0 27 Dec 2023
Preference as Reward, Maximum Preference Optimization with Importance Sampling Zaifan Jiang Xing Huang Chao Wei 105 2 0 27 Dec 2023
AutoTask: Executing Arbitrary Voice Commands by Exploring and Learning from Mobile GUI Lihang Pan Bowen Wang Chun Yu Yuxuan Chen Xiangyu Zhang Yuanchun Shi 84 3 0 26 Dec 2023
Aligning Large Language Models with Human Preferences through Representation Engineering Tianlong Li Xiaohua Wang Muling Wu Changze Lv Changze Lv Zixuan Ling Jianhao Zhu Cenyuan Zhang Xiaoqing Zheng Xuanjing Huang 69 41 0 26 Dec 2023
Typhoon: Thai Large Language Models Kunat Pipatanakul Phatrasek Jirabovonvisut Potsawee Manakul Sittipong Sripaisarnmongkol Ruangsak Patomwong Pathomporn Chokchainant Kasima Tharnpipitchai 107 17 0 21 Dec 2023
OpenRL: A Unified Reinforcement Learning Framework Shiyu Huang Wentse Chen Yiwen Sun Fuqing Bie Weijuan Tu 83 3 0 20 Dec 2023
InstructVideo: Instructing Video Diffusion Models with Human Feedback Hangjie Yuan Shiwei Zhang Xiang Wang Yujie Wei Tao Feng Yining Pan Yingya Zhang Ziwei Liu Samuel Albanie Dong Ni VGen 116 46 0 19 Dec 2023
Instruct-SCTG: Guiding Sequential Controlled Text Generation through Instructions Yinhong Liu Yixuan Su Ehsan Shareghi Nigel Collier 62 1 0 19 Dec 2023
HuTuMotion: Human-Tuned Navigation of Latent Motion Diffusion Models with Minimal Feedback Gaoge Han Shaoli Huang Biwei Huang Jinglei Tang VGen 60 2 0 19 Dec 2023
An Adaptive Placement and Parallelism Framework for Accelerating RLHF Training Youshao Xiao Weichang Wu Zhenglei Zhou Fagui Mao Shangchun Zhao Lin Ju Lei Liang Xiaolu Zhang Jun Zhou 83 6 0 19 Dec 2023
Explore 3D Dance Generation via Reward Model from Automatically-Ranked Demonstrations Zilin Wang Hao-Wen Zhuang Lu Li Yinmin Zhang Junjie Zhong Jun Chen Yu Yang Boshi Tang Zhiyong Wu 84 3 0 18 Dec 2023
Silkie: Preference Distillation for Large Visual Language Models Lei Li Zhihui Xie Mukai Li Shunian Chen Peiyi Wang Liang Chen Yazheng Yang Benyou Wang Lingpeng Kong MLLM 190 80 0 17 Dec 2023
Policy Optimization in RLHF: The Impact of Out-of-preference Data Ziniu Li Tian Xu Yang Yu 107 34 0 17 Dec 2023
Weak-to-Strong Generalization: Eliciting Strong Capabilities With Weak Supervision Collin Burns Pavel Izmailov Jan Hendrik Kirchner Bowen Baker Leo Gao ... Adrien Ecoffet Manas Joglekar Jan Leike Ilya Sutskever Jeff Wu ELM 143 299 0 14 Dec 2023
LLM-MARS: Large Language Model for Behavior Tree Generation and NLP-enhanced Dialogue in Multi-Agent Robot Systems Artem Lykov Maria Dronova Nikolay Naglov Mikhail Litvinov Sergei Satsevich Artem Bazhenov Vladimir Berman Aleksei Shcherbak Dzmitry Tsetserukou LLMAG LM&Ro 107 15 0 14 Dec 2023
Self-Evaluation Improves Selective Generation in Large Language Models Jie Jessie Ren Yao-Min Zhao Tu Vu Peter J. Liu Balaji Lakshminarayanan ELM 97 41 0 14 Dec 2023
Helping or Herding? Reward Model Ensembles Mitigate but do not Eliminate Reward Hacking Jacob Eisenstein Chirag Nagpal Alekh Agarwal Ahmad Beirami Alex DÁmour ... Katherine Heller Stephen Pfohl Deepak Ramachandran Peter Shaw Jonathan Berant 100 100 0 14 Dec 2023
Distributional Preference Learning: Understanding and Accounting for Hidden Context in RLHF Anand Siththaranjan Cassidy Laidlaw Dylan Hadfield-Menell 134 72 0 13 Dec 2023
Personalized Decision Supports based on Theory of Mind Modeling and Explainable Reinforcement Learning Huao Li Yao Fan Keyang Zheng Michael Lewis Katia Sycara 68 0 0 13 Dec 2023
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 197 5 0 13 Dec 2023
On Diversified Preferences of Large Language Model Alignment Dun Zeng Yong Dai Pengyu Cheng Longyue Wang Tianhao Hu Wanshun Chen Nan Du Zenglin Xu ALM 91 17 0 12 Dec 2023
Exploring Large Language Models to Facilitate Variable Autonomy for Human-Robot Teaming Younes Lakhnati Max Pascher Jens Gerken LLMAG LM&Ro 85 4 0 12 Dec 2023
Frugal LMs Trained to Invoke Symbolic Solvers Achieve Parameter-Efficient Arithmetic Reasoning Subhabrata Dutta Joykirat Singh Ishan Pandey Sunny Manchanda Soumen Chakrabarti Tanmoy Chakraborty ReLM LRM 88 4 0 09 Dec 2023
Is Feedback All You Need? Leveraging Natural Language Feedback in Goal-Conditioned Reinforcement Learning Sabrina McCallum Max Taylor-Davies Stefano V. Albrecht Alessandro Suglia 60 1 0 07 Dec 2023
Language Model Alignment with Elastic Reset Michael Noukhovitch Samuel Lavoie Florian Strub Aaron Courville KELM 164 27 0 06 Dec 2023
Mitigating Open-Vocabulary Caption Hallucinations Assaf Ben-Kish Moran Yanuka Morris Alper Raja Giryes Hadar Averbuch-Elor MLLM VLM 123 6 0 06 Dec 2023
PneumoLLM: Harnessing the Power of Large Language Model for Pneumoconiosis Diagnosis Meiyue Song Zhihua Yu Weiwen Zhang Jiarui Wang Yuting Lu ... Nikolaos I. Kanellakis Jiangfeng Liu Jing Wang Binglu Wang Juntao Yang LM&MA 80 0 0 06 Dec 2023
How should the advent of large language models affect the practice of science? Marcel Binz Stephan Alaniz Adina Roskies B. Aczel Carl T. Bergstrom ... Emily M. Bender M. Marelli Matthew M. Botvinick Zeynep Akata Eric Schulz 77 9 0 05 Dec 2023
ULMA: Unified Language Model Alignment with Human Demonstration and Point-wise Preference Tianchi Cai Xierui Song Jiyan Jiang Fei Teng Jinjie Gu Guannan Zhang ALM 94 5 0 05 Dec 2023
BEDD: The MineRL BASALT Evaluation and Demonstrations Dataset for Training and Benchmarking Agents that Solve Fuzzy Tasks Stephanie Milani Anssi Kanervisto Karolis Ramanauskas Sander Schulhoff Brandon Houghton Rohin Shah 80 7 0 05 Dec 2023