Title
RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization Hanyang Zhao Genta Indra Winata Anirban Das Shi-Xiong Zhang D. Yao Wenpin Tang Sambit Sahu 109 9 0 05 Oct 2024
Text2Chart31: Instruction Tuning for Chart Generation with Automatic Feedback Fatemeh Pesaran Zadeh Juyeon Kim Jin-Hwa Kim Gunhee Kim ALM 138 5 0 05 Oct 2024
Still Not Quite There! Evaluating Large Language Models for Comorbid Mental Health Diagnosis Amey Hengle Atharva Kulkarni Shantanu Patankar Madhumitha Chandrasekaran Sneha D'Silva Jemima Jacob Rashmi Gupta AI4MH 64 4 0 04 Oct 2024
KidLM: Advancing Language Models for Children -- Early Insights and Future Directions Mir Tafseer Nayeem Davood Rafiei ALM 120 3 0 04 Oct 2024
From Pixels to Personas: Investigating and Modeling Self-Anthropomorphism in Human-Robot Dialogues Yu Li Devamanyu Hazarika Di Jin Julia Hirschberg Yang Liu 67 1 0 04 Oct 2024
You Know What I'm Saying: Jailbreak Attack via Implicit Reference Tianyu Wu Lingrui Mei Ruibin Yuan Lujun Li Wei Xue Yike Guo 93 2 0 04 Oct 2024
Learning Code Preference via Synthetic Evolution Jiawei Liu Thanh Nguyen Mingyue Shang Hantian Ding Xiaopeng Li Yu Yu Varun Kumar Zijian Wang SyDa ALM AAML 72 11 0 04 Oct 2024
Misinformation with Legal Consequences (MisLC): A New Task Towards Harnessing Societal Harm of Misinformation Chu Fei Luo Radin Shayanfar R. Bhambhoria Samuel Dahan Xiaodan Zhu AILaw 60 0 0 04 Oct 2024
RAFT: Realistic Attacks to Fool Text Detectors James Wang Ran Li Junfeng Yang Chengzhi Mao AAML DeLMO 70 4 0 04 Oct 2024
Learning Humanoid Locomotion over Challenging Terrain Ilija Radosavovic Sarthak Kamat Trevor Darrell Jitendra Malik 80 14 0 04 Oct 2024
Aligning LLMs with Individual Preferences via Interaction Shujin Wu May Fung Cheng Qian Jeonghwan Kim Dilek Z. Hakkani-Tür Heng Ji 118 26 0 04 Oct 2024
Large Language Models can be Strong Self-Detoxifiers Ching-Yun Ko Pin-Yu Chen Payel Das Youssef Mroueh Soham Dan Georgios Kollias Subhajit Chaudhury Tejaswini Pedapati Luca Daniel 73 3 0 04 Oct 2024
TICKing All the Boxes: Generated Checklists Improve LLM Evaluation and Generation Jonathan Cook Tim Rocktaschel Jakob Foerster Dennis Aumiller Alex Wang ALM 111 16 0 04 Oct 2024
Understanding Reasoning in Chain-of-Thought from the Hopfieldian View Lijie Hu Liang Liu Shu Yang Xin Chen Zhen Tan Muhammad Asif Ali Mengdi Li Di Wang LRM 148 5 0 04 Oct 2024
SELU: Self-Learning Embodied MLLMs in Unknown Environments Boyu Li Haobin Jiang Ziluo Ding Xinrun Xu Haoran Li Dongbin Zhao Zongqing Lu LRM 90 3 0 04 Oct 2024
Enriching Music Descriptions with a Finetuned-LLM and Metadata for Text-to-Music Retrieval Seungheon Doh Minhee Lee Dasaem Jeong Juhan Nam 123 12 0 04 Oct 2024
ALR $^2$ : A Retrieve-then-Reason Framework for Long-context Question Answering Huayang Li Pat Verga Priyanka Sen Bowen Yang Vijay Viswanathan Patrick Lewis Taro Watanabe Yixuan Su RALM LRM 95 8 0 04 Oct 2024
Learning Semantic Structure through First-Order-Logic Translation Akshay Chaturvedi Nicholas Asher LRM 73 1 0 04 Oct 2024
Can LLMs Generate Diverse Molecules? Towards Alignment with Structural Diversity Hyosoon Jang Yunhui Jang Jaehyung Kim SungSoo Ahn 68 3 0 04 Oct 2024
SAG: Style-Aligned Article Generation via Model Collaboration Chenning Xu Fangxun Shu Dian Jin Jinghao Wei Hao Jiang ALM SyDa 77 0 0 04 Oct 2024
RIPPLECOT: Amplifying Ripple Effect of Knowledge Editing in Language Models via Chain-of-Thought In-Context Learning Zihao Zhao Yuchen Yang Yijiang Li Yinzhi Cao LRM KELM 69 1 0 04 Oct 2024
Frame-Voyager: Learning to Query Frames for Video Large Language Models Sicheng Yu Chengkai Jin Huanyu Wang Zhenghao Chen Sheng Jin ... Zhenbang Sun Bingni Zhang Jiawei Wu Hao Zhang Qianru Sun 180 9 0 04 Oct 2024
Structure-Enhanced Protein Instruction Tuning: Towards General-Purpose Protein Understanding with LLMs Wei Wu Chao Wang L. Chen Mingze Yin Yiheng Zhu Kun Fu Jieping Ye Hui Xiong Zheng Wang 149 1 0 04 Oct 2024
Can Language Models Reason about Individualistic Human Values and Preferences? Liwei Jiang Taylor Sorensen Sydney Levine Yejin Choi 154 14 0 04 Oct 2024
ToolGen: Unified Tool Retrieval and Calling via Generation Renxi Wang Xudong Han Lei Ji Shu Wang Timothy Baldwin Haonan Li LLMAG 193 9 0 04 Oct 2024
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step Wenxuan Wang Kuiyi Gao Zihan Jia Youliang Yuan Jen-tse Huang S. Wang Wenxiang Jiao Zhaopeng Tu 390 3 0 04 Oct 2024
Guided Stream of Search: Learning to Better Search with Language Models via Optimal Path Guidance Seungyong Moon Bumsoo Park Hyun Oh Song RALM AIFin 78 2 0 03 Oct 2024
Cognitive Biases in Large Language Models for News Recommendation Yougang Lyu Xiaoyu Zhang Zhaochun Ren Maarten de Rijke 104 4 0 03 Oct 2024
Neutral residues: revisiting adapters for model extension Franck Signe Talla Hervé Jégou Edouard Grave 78 1 0 03 Oct 2024
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge Jiayi Ye Yanbo Wang Yue Huang Dongping Chen Qihui Zhang ... Werner Geyer Chao Huang Pin-Yu Chen Nitesh Chawla Xiangliang Zhang ELM 138 78 0 03 Oct 2024
HiddenGuard: Fine-Grained Safe Generation with Specialized Representation Router Lingrui Mei Shenghua Liu Yiwei Wang Baolong Bi Ruibin Yuan Xueqi Cheng 120 5 0 03 Oct 2024
Hate Personified: Investigating the role of LLMs in content moderation Sarah Masud Sahajpreet Singh Viktor Hangya Alexander Fraser Tanmoy Chakraborty 71 9 0 03 Oct 2024
Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning Tianxiang Hu Pei Zhang Baosong Yang Jun Xie Derek F. Wong Rui Wang ALM LRM 96 4 0 03 Oct 2024
Towards Implicit Bias Detection and Mitigation in Multi-Agent LLM Interactions Angana Borah Rada Mihalcea 108 15 0 03 Oct 2024
Reward-RAG: Enhancing RAG with Reward Driven Supervision Thang Nguyen Peter Chin Yu-Wing Tai RALM 132 5 0 03 Oct 2024
How Much Can RAG Help the Reasoning of LLM? Jingyu Liu Jiaen Lin Yong Liu LRM 91 13 0 03 Oct 2024
Mitigating Downstream Model Risks via Model Provenance Keyu Wang Abdullah Norozi Iranzad Scott Schaffter Doina Precup Jonathan Lebensold 103 1 0 03 Oct 2024
Efficiently Deploying LLMs with Controlled Risk Michael J. Zellinger Matt Thomson 99 1 0 03 Oct 2024
OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable? Liangze Jiang Damien Teney OODD OOD 145 1 0 03 Oct 2024
The Role of Deductive and Inductive Reasoning in Large Language Models Chengkun Cai Xu Zhao Haoliang Liu Zhongyu Jiang Tianfang Zhang Zongkai Wu Lei Li Lei Li LRM 134 4 0 03 Oct 2024
How to Train Long-Context Language Models (Effectively) Tianyu Gao Alexander Wettig Howard Yen Danqi Chen RALM 208 48 0 03 Oct 2024
AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs Xiaogeng Liu Peiran Li Edward Suh Yevgeniy Vorobeychik Zhuoqing Mao Somesh Jha Patrick McDaniel Huan Sun Bo Li Chaowei Xiao 147 32 0 03 Oct 2024
Jailbreak Antidote: Runtime Safety-Utility Balance via Sparse Representation Adjustment in Large Language Models Guobin Shen Dongcheng Zhao Yiting Dong Xiang He Yi Zeng AAML 120 4 0 03 Oct 2024
Undesirable Memorization in Large Language Models: A Survey Ali Satvaty Suzan Verberne Fatih Turkmen ELM PILM 210 7 0 03 Oct 2024
LLaVA-Critic: Learning to Evaluate Multimodal Models Tianyi Xiong Xinze Wang Dong Guo Qinghao Ye Haoqi Fan Quanquan Gu Heng Huang Chunyuan Li MLLM VLM LRM 150 53 0 03 Oct 2024
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences Genta Indra Winata David Anugraha Lucky Susanto Garry Kuwanto Derry Wijaya 190 11 0 03 Oct 2024
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions Yekun Chai Haoran Sun Huang Fang Shuohuan Wang Yu Sun Hua Wu 485 4 0 03 Oct 2024
Towards the Pedagogical Steering of Large Language Models for Tutoring: A Case Study with Modeling Productive Failure Romain Puech Jakub Macina Julia Chatain Mrinmaya Sachan Manu Kapur AI4Ed 109 5 0 03 Oct 2024
RLEF: Grounding Code LLMs in Execution Feedback with Reinforcement Learning Jonas Gehring Kunhao Zheng Jade Copet Vegard Mella Taco Cohen Gabriel Synnaeve LLMAG 68 36 0 02 Oct 2024
Generative Reward Models Dakota Mahan Duy Phung Rafael Rafailov Chase Blagden Nathan Lile Louis Castricato Jan-Philipp Fränken Chelsea Finn Alon Albalak VLM SyDa OffRL 88 42 0 02 Oct 2024