Title
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning Zhiheng Xi Wenxiang Chen Boyang Hong Senjie Jin Rui Zheng ... Xinbo Zhang Peng Sun Tao Gui Qi Zhang Xuanjing Huang LRM 42 21 0 08 Feb 2024
Comprehensive Assessment of Jailbreak Attacks Against LLMs Junjie Chu Yugeng Liu Ziqing Yang Xinyue Shen Michael Backes Yang Zhang AAML 40 67 0 08 Feb 2024
Merging Facts, Crafting Fallacies: Evaluating the Contradictory Nature of Aggregated Factual Claims in Long-Form Generations Cheng-Han Chiang Hung-yi Lee HILM 75 8 0 08 Feb 2024
Pedagogical Alignment of Large Language Models Shashank Sonkar Kangqi Ni Sapana Chaudhary Richard G. Baraniuk AI4Ed 15 6 0 07 Feb 2024
InfLLM: Training-Free Long-Context Extrapolation for LLMs with an Efficient Context Memory Chaojun Xiao Pengle Zhang Xu Han Guangxuan Xiao Yankai Lin Zhengyan Zhang Zhiyuan Liu Maosong Sun LLMAG 47 35 0 07 Feb 2024
ScreenAI: A Vision-Language Model for UI and Infographics Understanding Gilles Baechler Srinivas Sunkara Maria Wang Fedir Zubach Hassan Mansoor Vincent Etter Victor Carbune Jason Lin Jindong Chen Abhanshu Sharma 123 47 0 07 Feb 2024
Training Language Models to Generate Text with Citations via Fine-grained Rewards Chengyu Huang Zeqiu Wu Yushi Hu Wenya Wang HILM LRM 79 26 0 06 Feb 2024
Personalized Language Modeling from Personalized Human Feedback Xinyu Li Zachary C. Lipton Liu Leqi ALM 71 48 0 06 Feb 2024
V-IRL: Grounding Virtual Intelligence in Real Life Jihan Yang Runyu Ding Ellis L Brown Xiaojuan Qi Saining Xie LM&Ro 56 19 0 05 Feb 2024
Factuality of Large Language Models in the Year 2024 Yuxia Wang Minghan Wang Muhammad Arslan Manzoor Fei Liu Georgi Georgiev Rocktim Jyoti Das Preslav Nakov LRM HILM 38 7 0 04 Feb 2024
Enhance Reasoning for Large Language Models in the Game Werewolf Shuang Wu Liwen Zhu Tao Yang Shiwei Xu Qiang Fu Yang Wei Haobo Fu LRM LLMAG 82 18 0 04 Feb 2024
Affordable Generative Agents Yangbin Yu Qin Zhang Junyou Li Qiang Fu Deheng Ye LLMAG AI4CE 45 5 0 03 Feb 2024
How well do LLMs cite relevant medical references? An evaluation framework and analyses Kevin Wu Eric Wu Ally Cassasola Angela Zhang Kevin Wei Teresa Nguyen Sith Riantawan Patricia Shi Riantawan Daniel E. Ho James Zou LM&MA ELM AI4MH 31 26 0 03 Feb 2024
TravelPlanner: A Benchmark for Real-World Planning with Language Agents Jian Xie Kai Zhang Jiangjie Chen Tinghui Zhu Renze Lou Yuandong Tian Yanghua Xiao Yu-Chuan Su LLMAG LM&Ro 62 132 0 02 Feb 2024
Building Guardrails for Large Language Models Yizhen Dong Ronghui Mu Gao Jin Yi Qi Jinwei Hu Xingyu Zhao Jie Meng Wenjie Ruan Xiaowei Huang OffRL 63 27 0 02 Feb 2024
AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback Jian Guan Wei Wu Zujie Wen Peng Xu Hongning Wang Minlie Huang LRM 29 16 0 02 Feb 2024
Rethinking the Role of Proxy Rewards in Language Model Alignment Sungdong Kim Minjoon Seo SyDa ALM 31 0 0 02 Feb 2024
LLM-based NLG Evaluation: Current Status and Challenges Mingqi Gao Xinyu Hu Jie Ruan Xiao Pu Xiaojun Wan ELM LM&MA 65 29 0 02 Feb 2024
Plan-Grounded Large Language Models for Dual Goal Conversational Settings Diogo Glória-Silva Rafael Ferreira Diogo Tavares David Semedo João Magalhães LLMAG 45 4 0 01 Feb 2024
Executable Code Actions Elicit Better LLM Agents Xingyao Wang Yangyi Chen Lifan Yuan Yizhe Zhang Yunzhu Li Hao Peng Heng Ji ELM LLMAG LM&Ro 40 132 0 01 Feb 2024
Don't Hallucinate, Abstain: Identifying LLM Knowledge Gaps via Multi-LLM Collaboration Shangbin Feng Weijia Shi Yike Wang Wenxuan Ding Vidhisha Balachandran Yulia Tsvetkov 31 78 0 01 Feb 2024
Efficient Non-Parametric Uncertainty Quantification for Black-Box Large Language Models and Decision Planning Yao-Hung Tsai Walter Talbott Jian Zhang LLMAG 18 4 0 01 Feb 2024
Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF Banghua Zhu Michael I. Jordan Jiantao Jiao 31 25 0 29 Jan 2024
PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models Haochen Tan Zhijiang Guo Zhan Shi Lu Xu Zhili Liu ... Xiaoguang Li Yasheng Wang Lifeng Shang Qun Liu Linqi Song 43 12 0 26 Jan 2024
Benchmarking Large Language Models in Complex Question Answering Attribution using Knowledge Graphs Nan Hu Jiaoyan Chen Yike Wu Guilin Qi Sheng Bi Tongtong Wu Jeff Z. Pan HILM 39 8 0 26 Jan 2024
WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models Hongliang He Wenlin Yao Kaixin Ma Wenhao Yu Yong Dai Hongming Zhang Zhenzhong Lan Dong Yu LLMAG 40 121 0 25 Jan 2024
UniMS-RAG: A Unified Multi-source Retrieval-Augmented Generation for Personalized Dialogue Systems Hongru Wang Wenyu Huang Yang Deng Rui Wang Zezhong Wang Yufei Wang Fei Mi Jeff Z. Pan Kam-Fai Wong RALM 43 27 0 24 Jan 2024
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents Chang Ma Junlei Zhang Zhihao Zhu Cheng Yang Yujiu Yang Yaohui Jin Zhenzhong Lan Lingpeng Kong Junxian He ELM LLMAG 37 59 0 24 Jan 2024
ARGS: Alignment as Reward-Guided Search Maxim Khanov Jirayu Burapacheep Yixuan Li 35 46 0 23 Jan 2024
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback Songyang Gao Qiming Ge Wei Shen Shihan Dou Junjie Ye ... Yicheng Zou Zhi Chen Hang Yan Qi Zhang Dahua Lin 57 11 0 21 Jan 2024
Reinforcement learning for question answering in programming domain using public community scoring as a human feedback Alexey Gorbatovski Sergey Kovalchuk 17 3 0 19 Jan 2024
R-Judge: Benchmarking Safety Risk Awareness for LLM Agents Tongxin Yuan Zhiwei He Lingzhong Dong Yiming Wang Ruijie Zhao ... Binglin Zhou Fangqi Li Zhuosheng Zhang Rui Wang Gongshen Liu ELM 34 62 0 18 Jan 2024
QAnswer: Towards Question Answering Search over Websites Kunpeng Guo Clement Defretiere Dennis Diefenbach Christophe Gravier Antoine Gourru 34 4 0 17 Jan 2024
A Study on Training and Developing Large Language Models for Behavior Tree Generation Fu Li Xueying Wang Bin Li Yunlong Wu Yanzhen Wang Xiaodong Yi 14 4 0 16 Jan 2024
DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models (Exemplified as A Video Agent) Zongxin Yang Guikun Chen Xiaodi Li Wenguan Wang Yi Yang LM&Ro LLMAG 69 35 0 16 Jan 2024
The What, Why, and How of Context Length Extension Techniques in Large Language Models -- A Detailed Survey Saurav Pawar S.M. Towhidul Islam Tonmoy S. M. M. Zaman Vinija Jain Aman Chadha Amitava Das 37 28 0 15 Jan 2024
Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation Meng Cao Lei Shu Lei Yu Yun Zhu Nevan Wichers Yinxiao Liu Lei Meng OffRL ALM 27 4 0 14 Jan 2024
Small LLMs Are Weak Tool Learners: A Multi-LLM Agent Weizhou Shen Chenliang Li Hongzhan Chen Ming Yan Xiaojun Quan Hehong Chen Ji Zhang Fei Huang LLMAG 45 48 0 14 Jan 2024
EHRAgent: Code Empowers Large Language Models for Few-shot Complex Tabular Reasoning on Electronic Health Records Wenqi Shi Ran Xu Yuchen Zhuang Yue Yu Jieyu Zhang Hang Wu Yuanda Zhu Joyce C. Ho Carl Yang M. D. Wang 29 27 0 13 Jan 2024
INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning Yutao Zhu Peitian Zhang Chenghao Zhang Yifei Chen Binyu Xie Zheng Liu Ji-Rong Wen Zhicheng Dou 21 15 0 12 Jan 2024
Risk Taxonomy, Mitigation, and Assessment Benchmarks of Large Language Model Systems Tianyu Cui Yanling Wang Chuanpu Fu Yong Xiao Sijia Li ... Junwu Xiong Xinyu Kong Zujie Wen Ke Xu Qi Li 63 56 0 11 Jan 2024
MLLM-Protector: Ensuring MLLM's Safety without Hurting Performance Renjie Pi Tianyang Han Jianshu Zhang Yueqi Xie Rui Pan Qing Lian Hanze Dong Jipeng Zhang Tong Zhang AAML 23 59 0 05 Jan 2024
From LLM to Conversational Agent: A Memory Enhanced Architecture with Fine-Tuning of Large Language Models Na Liu Liangyu Chen Xiaoyu Tian Wei Zou Kaijiang Chen Ming Cui LLMAG 38 28 0 05 Jan 2024
Hyperparameter-Free Approach for Faster Minimum Bayes Risk Decoding Yuu Jinnai Kaito Ariu 29 8 0 05 Jan 2024
Understanding LLMs: A Comprehensive Overview from Training to Inference Yi-Hsueh Liu Haoyang He Tianle Han Xu-Yao Zhang Mengyuan Liu ... Xintao Hu Tuo Zhang Ning Qiang Tianming Liu Bao Ge SyDa 35 65 0 04 Jan 2024
Theoretical guarantees on the best-of-n alignment policy Ahmad Beirami Alekh Agarwal Jonathan Berant Alex DÁmour Jacob Eisenstein Chirag Nagpal A. Suresh 50 42 0 03 Jan 2024
If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents Ke Yang Jiateng Liu John Wu Chaoqi Yang Yi R. Fung ... Xu Cao Xingyao Wang Yiquan Wang Chenhui Xu Chengxiang Zhai LLMAG ELM 26 75 0 01 Jan 2024
GitAgent: Facilitating Autonomous Agent with GitHub by Tool Extension Bohan Lyu Xin Cong Heyang Yu Pan Yang Yujia Qin ... Zhong Zhang Yukun Yan Yankai Lin Zhiyuan Liu Maosong Sun LLMAG 38 5 0 28 Dec 2023
ShennongAlpha: an AI-driven sharing and collaboration platform for intelligent curation, acquisition, and translation of natural medicinal material knowledge Zijie YANG Yongjing Yin Chaojun Kong Tiange Chi Wufan Tao Yue Zhang Tian Xu 11 1 0 27 Dec 2023
LARP: Language-Agent Role Play for Open-World Games Ming Yan Ruihao Li Hao Zhang Hao Wang Zhilan Yang Ji Yan LLMAG LM&Ro AI4CE 30 16 0 24 Dec 2023