Title
Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought James Chua Edward Rees Hunar Batra Samuel R. Bowman Julian Michael Ethan Perez Miles Turpin LRM 127 13 0 08 Mar 2024
Automatic and Universal Prompt Injection Attacks against Large Language Models Xiaogeng Liu Zhiyuan Yu Yizhe Zhang Ning Zhang Chaowei Xiao SILM AAML 99 49 0 07 Mar 2024
A Survey on Human-AI Teaming with Large Pre-Trained Models Vanshika Vats Marzia Binta Nizam Minghao Liu Ziyuan Wang Richard Ho ... Celeste Shen Rachel Shen Nafisa Hussain Kesav Ravichandran James Davis LM&MA 124 10 0 07 Mar 2024
Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification Ekaterina Fadeeva Aleksandr Rubashevskii Artem Shelmanov Sergey Petrakov Haonan Li ... Gleb Kuzmin Alexander Panchenko Timothy Baldwin Preslav Nakov Maxim Panov HILM 102 56 0 07 Mar 2024
Yi: Open Foundation Models by 01.AI 01. AI Alex Young 01.AI Alex Young Bei Chen Chao Li ... Yue Wang Yuxuan Cai Zhenyu Gu Zhiyuan Liu Zonghong Dai OSLM LRM 323 577 0 07 Mar 2024
Teaching Large Language Models to Reason with Reinforcement Learning Alex Havrilla Yuqing Du Sharath Chandra Raparthy Christoforos Nalmpantis Jane Dwivedi-Yu Maksym Zhuravinskyi Eric Hambro Sainbayar Sukhbaatar Roberta Raileanu ReLM LRM 113 94 0 07 Mar 2024
CAT: Enhancing Multimodal Large Language Model to Answer Questions in Dynamic Audio-Visual Scenarios Qilang Ye Zitong Yu Rui Shao Xinyu Xie Philip Torr Xiaochun Cao MLLM 112 30 0 07 Mar 2024
NLPre: a revised approach towards language-centric benchmarking of Natural Language Preprocessing systems Martyna Wia̧cek Piotr Rybak Lukasz Pszenny Alina Wróblewska 67 1 0 07 Mar 2024
GraphInstruct: Empowering Large Language Models with Graph Understanding and Reasoning Capability Zihan Luo Xiran Song Hong Huang Jianxun Lian Chenhao Zhang Jinqi Jiang Xing Xie LRM 94 33 0 07 Mar 2024
Pearl: A Review-driven Persona-Knowledge Grounded Conversational Recommendation Dataset Minjin Kim Minju Kim Hana Kim Beong-woo Kwak Soyeon Chun Hyunseo Kim SeongKu Kang Youngjae Yu Jinyoung Yeo Dongha Lee RALM 99 13 0 07 Mar 2024
Proxy-RLHF: Decoupling Generation and Alignment in Large Language Model with Proxy Yu Zhu Chuxiong Sun Wenfei Yang Wenqiang Wei Simin Niu ... Zhiyu Li Shifeng Zhang Feiyu Xiong Jie Hu Mingchuan Yang 59 3 0 07 Mar 2024
Evaluation of LLMs on Syntax-Aware Code Fill-in-the-Middle Tasks Linyuan Gong Sida Wang Mostafa Elhoushi Alvin Cheung 124 17 0 07 Mar 2024
Aligners: Decoupling LLMs and Alignment Lilian Ngweta Mayank Agarwal Subha Maity Alex Gittens Yuekai Sun Mikhail Yurochkin 67 2 0 07 Mar 2024
On the Essence and Prospect: An Investigation of Alignment Approaches for Big Models Xinpeng Wang Shitong Duan Xiaoyuan Yi Jing Yao Shanlin Zhou Zhihua Wei Peng Zhang Dongkuan Xu Maosong Sun Xing Xie OffRL 122 17 0 07 Mar 2024
Preference optimization of protein language models as a multi-objective binder design paradigm Pouria A. Mistani Venkatesh Mysore 51 8 0 07 Mar 2024
Bridging Text and Molecule: A Survey on Multimodal Frameworks for Molecule Yi Xiao Xiangxin Zhou Qiang Liu Liang Wang AI4CE 66 3 0 07 Mar 2024
CoTBal: Comprehensive Task Balancing for Multi-Task Visual Instruction Tuning Yanqi Dai Dong Jing Nanyi Fei Zhiwu Lu Nanyi Fei Guoxing Yang Zhiwu Lu 112 3 0 07 Mar 2024
MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation Zhongwei Wan Che Liu Xin Wang Chaofan Tao Hui Shen Zhenwu Peng Jie Fu Rossella Arcucci Huaxiu Yao 108 10 0 07 Mar 2024
Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation M. Torné Anthony Simeonov Zechu Li April Chan Tao Chen Abhishek Gupta Pulkit Agrawal 112 70 0 06 Mar 2024
Neural Exec: Learning (and Learning from) Execution Triggers for Prompt Injection Attacks Dario Pasquini Martin Strohmeier Carmela Troncoso AAML 112 28 0 06 Mar 2024
Popeye: A Unified Visual-Language Model for Multi-Source Ship Detection from Remote Sensing Imagery Wei Zhang Miaoxin Cai Tong Zhang Guoqiang Lei Zhuang Yin Xuerui Mao 76 8 0 06 Mar 2024
MedSafetyBench: Evaluating and Improving the Medical Safety of Large Language Models Tessa Han Aounon Kumar Chirag Agarwal Himabindu Lakkaraju ELM LM&MA AI4MH 56 10 0 06 Mar 2024
Benchmarking Hallucination in Large Language Models based on Unanswerable Math Word Problem Yuhong Sun Zhangyue Yin Qipeng Guo Jiawen Wu Xipeng Qiu Hui Zhao 65 19 0 06 Mar 2024
Towards Efficient and Effective Unlearning of Large Language Models for Recommendation Hangyu Wang Jianghao Lin Bo Chen Yang Yang Ruiming Tang Weinan Zhang Yong Yu MU 105 11 0 06 Mar 2024
Human vs. Machine: Behavioral Differences Between Expert Humans and Language Models in Wargame Simulations Max Lamparth Anthony Corso Jacob Ganz O. Mastro Jacquelyn G. Schneider Harold Trinkunas 92 9 0 06 Mar 2024
"It's the only thing I can trust": Envisioning Large Language Model Use by Autistic Workers for Communication Assistance JiWoong Jang Sanika Moharana Patrick Carrington Andrew Begel 63 28 0 05 Mar 2024
AI Insights: A Case Study on Utilizing ChatGPT Intelligence for Research Paper Analysis Anjalee de Silva Janaka Wijekoon Rashini K. Liyanarachchi Rrubaa Panchendrarajan Weranga Rajapaksha LM&MA 39 3 0 05 Mar 2024
Should We Fear Large Language Models? A Structural Analysis of the Human Reasoning System for Elucidating LLM Capabilities and Risks Through the Lens of Heidegger's Philosophy Jianqiiu Zhang ELM 69 1 0 05 Mar 2024
The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning Nathaniel Li Alexander Pan Anjali Gopal Summer Yue Daniel Berrios ... Yan Shoshitaishvili Jimmy Ba K. Esvelt Alexandr Wang Dan Hendrycks ELM 129 195 0 05 Mar 2024
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets Hossein Aboutalebi Hwanjun Song Yusheng Xie Arshit Gupta Justin Sun Hang Su Igor Shalyminov Nikolaos Pappas Siffi Singh Saab Mansour DiffM EGVM 94 5 0 05 Mar 2024
Reliable, Adaptable, and Attributable Language Models with Retrieval Akari Asai Zexuan Zhong Danqi Chen Pang Wei Koh Luke Zettlemoyer Hanna Hajishirzi Wen-tau Yih KELM RALM 116 63 0 05 Mar 2024
"In Dialogues We Learn": Towards Personalized Dialogue Without Pre-defined Profiles through In-Dialogue Learning Chuanqi Cheng Quan Tu Wei Wu Shuo Shang Cunli Mao Zhengtao Yu Rui Yan 98 5 0 05 Mar 2024
Localized Zeroth-Order Prompt Optimization Wenyang Hu Yao Shu Zongmin Yu Zhaoxuan Wu Xiangqiang Lin Zhongxiang Dai See-Kiong Ng Bryan Kian Hsiang Low 63 8 0 05 Mar 2024
Demonstrating Mutual Reinforcement Effect through Information Flow Chengguang Gan Xuzheng He Qinghao Zhang Tatsunori Mori 77 0 0 05 Mar 2024
Zero-Shot Cross-Lingual Document-Level Event Causality Identification with Heterogeneous Graph Contrastive Transfer Learning Zhitao He Pengfei Cao Zhuoran Jin Yubo Chen Kang Liu Qing Cui Mengshu Sun Jun Zhao 82 3 0 05 Mar 2024
Role Prompting Guided Domain Adaptation with General Capability Preserve for Large Language Models Rui Wang Fei Mi Yi Chen Boyang Xue Hongru Wang Qi Zhu Kam-Fai Wong Rui-Lan Xu CLL 73 7 0 05 Mar 2024
InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents Qiusi Zhan Zhixiang Liang Zifan Ying Daniel Kang LLMAG 131 105 0 05 Mar 2024
Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters Weizhi Wang Khalil Mrini Linjie Yang Sateesh Kumar Yu Tian Xifeng Yan Heng Wang 85 17 0 05 Mar 2024
Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use Imad Eddine Toubal Aditya Avinash N. Alldrin Jan Dlabal Wenlei Zhou ... Chun-Ta Lu Howard Zhou Ranjay Krishna Ariel Fuxman Tom Duerig VLM 145 7 0 05 Mar 2024
Exploring the Limitations of Large Language Models in Compositional Relation Reasoning Jinman Zhao Xueyan Zhang BDL LRM 73 4 0 05 Mar 2024
ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary Yutong Li Lu Chen Aiwei Liu Kai Yu Lijie Wen 95 22 0 05 Mar 2024
Alpaca against Vicuna: Using LLMs to Uncover Memorization of LLMs Aly M. Kassem Omar Mahmoud Niloofar Mireshghallah Hyunwoo J. Kim Yulia Tsvetkov Yejin Choi Sherif Saad Santu Rana 139 22 0 05 Mar 2024
Enhancing Vision-Language Pre-training with Rich Supervisions Yuan Gao Kunyu Shi Pengkai Zhu Edouard Belval Oren Nuriel Srikar Appalaraju Shabnam Ghadar Vijay Mahadevan Zhuowen Tu Stefano Soatto VLM CLIP 168 12 0 05 Mar 2024
DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation Xueqing Wu Rui Zheng Jingzhen Sha Te-Lin Wu Hanyu Zhou Mohan Tang Kai-Wei Chang Nanyun Peng Haoran Huang 108 2 0 04 Mar 2024
Trial and Error: Exploration-Based Trajectory Optimization for LLM Agents Yifan Song Da Yin Xiang Yue Jie Huang Sujian Li Bill Yuchen Lin 107 83 0 04 Mar 2024
Vision-Language Models for Medical Report Generation and Visual Question Answering: A Review Iryna Hartsock Ghulam Rasool 102 82 0 04 Mar 2024
RegionGPT: Towards Region Understanding Vision Language Model Qiushan Guo Shalini De Mello Hongxu Yin Wonmin Byeon Ka Chun Cheung Yizhou Yu Ping Luo Sifei Liu VLM 100 37 0 04 Mar 2024
RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models Saeed Najafi Alona Fyshe 78 2 0 04 Mar 2024
Vanilla Transformers are Transfer Capability Teachers Xin Lu Yanyan Zhao Bing Qin MoE 62 0 0 04 Mar 2024
Online Training of Large Language Models: Learn while chatting Juhao Liang Ziwei Wang Zhuoheng Ma Jianquan Li Zhiyi Zhang Xiangbo Wu Benyou Wang KELM 108 4 0 04 Mar 2024