Title
Beyond Traditional Benchmarks: Analyzing Behaviors of Open LLMs on Data-to-Text Generation Zdeněk Kasner Ondrej Dusek 142 11 0 18 Jan 2024
Code Prompting Elicits Conditional Reasoning Abilities in Text+Code LLMs Haritz Puerto Martin Tutek Somak Aditya Xiaodan Zhu Iryna Gurevych ReCod ReLM LRM 121 15 0 18 Jan 2024
DiffusionGPT: LLM-Driven Text-to-Image Generation System Jie Qin Jie Wu Weifeng Chen Yuxi Ren Huixian Li Hefeng Wu Xuefeng Xiao Rui Wang S. Wen DiffM 111 35 0 18 Jan 2024
Large Language Models for Scientific Information Extraction: An Empirical Study for Virology Mahsa Shamsabadi Jennifer D'Souza Sören Auer 92 8 0 18 Jan 2024
R-Judge: Benchmarking Safety Risk Awareness for LLM Agents Tongxin Yuan Zhiwei He Lingzhong Dong Yiming Wang Ruijie Zhao ... Binglin Zhou Fangqi Li Zhuosheng Zhang Rui Wang Gongshen Liu ELM 129 87 0 18 Jan 2024
Veagle: Advancements in Multimodal Representation Learning Rajat Chawla Arkajit Datta Tushar Verma Adarsh Jha Anmol Gautam Ayush Vatsal Sukrit Chaterjee NS Mukunda Ishaan Bhola VLM 71 4 0 18 Jan 2024
Temporal Insight Enhancement: Mitigating Temporal Hallucination in Multimodal Large Language Models Li Sun Liuan Wang Jun Sun Takayuki Okatani MLLM 52 0 0 18 Jan 2024
All in How You Ask for It: Simple Black-Box Method for Jailbreak Attacks Kazuhiro Takemoto 118 26 0 18 Jan 2024
Self-Rewarding Language Models Weizhe Yuan Richard Yuanzhe Pang Kyunghyun Cho Xian Li Sainbayar Sukhbaatar Jing Xu Jason Weston ReLM SyDa ALM LRM 434 340 0 18 Jan 2024
Large Language Models Help Reveal Unhealthy Diet and Body Concerns in Online Eating Disorders Communities Minh Duc Hoang Chu Zihao He Rebecca Dorn Kristina Lerman 54 0 0 17 Jan 2024
Code Simulation Challenges for Large Language Models Emanuele La Malfa Christoph Weinhuber Orazio Torre Fangru Lin Samuele Marro Anthony Cohn Nigel Shadbolt Michael Wooldridge LLMAG LRM 71 8 0 17 Jan 2024
Canvil: Designerly Adaptation for LLM-Powered User Experiences K. J. Kevin Feng Q. V. Liao Ziang Xiao Jennifer Wortman Vaughan Amy X. Zhang David W. McDonald 101 19 0 17 Jan 2024
Augmenting Math Word Problems via Iterative Question Composing Haoxiong Liu Yifan Zhang Yifan Luo Andrew Chi-Chih Yao SyDa LRM 164 46 0 17 Jan 2024
AttackEval: How to Evaluate the Effectiveness of Jailbreak Attacking on Large Language Models Dong Shu Mingyu Jin Suiyuan Zhu Beichen Wang Zihao Zhou Chong Zhang Yongfeng Zhang ELM 100 15 0 17 Jan 2024
ReFT: Reasoning with Reinforced Fine-Tuning Trung Quoc Luong Xinbo Zhang Zhanming Jie Peng Sun Xiaoran Jin Hang Li OffRL LRM ReLM 119 132 0 17 Jan 2024
A New Creative Generation Pipeline for Click-Through Rate with Stable Diffusion Model Hao Yang Jianxin Yuan Shuai Yang Linhe Xu Shuo Yuan Yifan Zeng 81 11 0 17 Jan 2024
Crowd-PrefRL: Preference-Based Reward Learning from Crowds David Chhan Ellen R. Novoseller Vernon J. Lawhern 163 5 0 17 Jan 2024
Deductive Closure Training of Language Models for Coherence, Accuracy, and Updatability Afra Feyza Akyürek Ekin Akyürek Leshem Choshen Derry Wijaya Jacob Andreas HILM SyDa 133 18 0 16 Jan 2024
Tuning Language Models by Proxy Alisa Liu Xiaochuang Han Yizhong Wang Yulia Tsvetkov Yejin Choi Noah A. Smith ALM 98 52 0 16 Jan 2024
Scalable Pre-training of Large Autoregressive Image Models Alaaeldin El-Nouby Michal Klein Shuangfei Zhai Miguel Angel Bautista Alexander Toshev Vaishaal Shankar J. Susskind Armand Joulin VLM 107 80 0 16 Jan 2024
Instilling Multi-round Thinking to Text-guided Image Generation Lidong Zeng Zhedong Zheng Yinwei Wei Tat-Seng Chua 113 5 0 16 Jan 2024
Machine Translation with Large Language Models: Prompt Engineering for Persian, English, and Russian Directions Nooshin Pourkamali Shler Ebrahim Sharifi LRM 71 9 0 16 Jan 2024
Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation Haoran Xu Amr Sharaf Yunmo Chen Weiting Tan Lingfeng Shen Benjamin Van Durme Kenton W. Murray Young Jin Kim ALM 139 266 0 16 Jan 2024
RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture M. A. D. L. Balaguer Vinamra Benara Renato Luiz de Freitas Cunha Roberto de M. Estevao Filho Todd Hendry ... Morris Sharp B. Silva Swati Sharma Vijay Aski Ranveer Chandra FaML 132 92 0 16 Jan 2024
Salute the Classic: Revisiting Challenges of Machine Translation in the Age of Large Language Models Jianhui Pang Fanghua Ye Longyue Wang Dian Yu Derek F. Wong Shuming Shi Zhaopeng Tu ALM 98 7 0 16 Jan 2024
Application of LLM Agents in Recruitment: A Novel Framework for Resume Screening Chengguang Gan Qinghao Zhang Tatsunori Mori 99 23 0 16 Jan 2024
SAPT: A Shared Attention Framework for Parameter-Efficient Continual Learning of Large Language Models Weixiang Zhao Shilong Wang Yulin Hu Yanyan Zhao Bing Qin Xuanyu Zhang Qing Yang Dongliang Xu Wanxiang Che KELM CLL 108 16 0 16 Jan 2024
Large Language Models are Null-Shot Learners Pittawat Taveekitworachai Febri Abdullah R. Thawonmas LRM 51 2 0 16 Jan 2024
PRewrite: Prompt Rewriting with Reinforcement Learning Weize Kong Spurthi Amba Hombaiah Mingyang Zhang Qiaozhu Mei Michael Bendersky LLMAG 54 17 0 16 Jan 2024
Consolidating Strategies for Countering Hate Speech Using Persuasive Dialogues Sougata Saha Rohini Srihari 67 1 0 15 Jan 2024
On the importance of Data Scale in Pretraining Arabic Language Models Abbas Ghaddar Philippe Langlais Mehdi Rezagholizadeh Boxing Chen 60 0 0 15 Jan 2024
Empirical Evidence for the Fragment level Understanding on Drug Molecular Structure of LLMs Xiuyuan Hu Guoqing Liu Yang Zhao Hao Zhang 71 1 0 15 Jan 2024
Developing ChatGPT for Biology and Medicine: A Complete Review of Biomedical Question Answering Qing Li Lei Li Yu Li LM&MA AI4MH 107 7 0 15 Jan 2024
Stability Analysis of ChatGPT-based Sentiment Analysis in AI Quality Assurance Tinghui Ouyang AprilPyone Maungmaung Koichi Konishi Yoshiki Seo Isao Echizen AI4MH 77 8 0 15 Jan 2024
Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation Meng Cao Lei Shu Lei Yu Yun Zhu Nevan Wichers Yinxiao Liu Lei Meng OffRL ALM 64 7 0 14 Jan 2024
PersonalityChat: Conversation Distillation for Personalized Dialog Modeling with Facts and Traits Ehsan Lotfi Maxime De Bruyn Jeska Buhmann Walter Daelemans 67 4 0 14 Jan 2024
Small Language Model Can Self-correct Haixia Han Jiaqing Liang Jie Shi Qi He Yanghua Xiao LRM SyDa ReLM KELM 106 15 0 14 Jan 2024
Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models Zhengxin Zhang Dan Zhao Xupeng Miao Gabriele Oliaro Qing Li Yong Jiang Zhihao Jia MQ 90 9 0 13 Jan 2024
Leveraging Large Language Models for NLG Evaluation: Advances and Challenges Zhen Li Xiaohan Xu Tao Shen Can Xu Jia-Chen Gu Yuxuan Lai Chongyang Tao Shuai Ma LM&MA ELM 136 15 0 13 Jan 2024
xCoT: Cross-lingual Instruction Tuning for Cross-lingual Chain-of-Thought Reasoning Linzheng Chai Jian Yang Tao Sun Hongcheng Guo Jiaheng Liu ... Xiannian Liang Jiaqi Bai Tongliang Li Qiyao Peng Zhoujun Li LRM 102 54 0 13 Jan 2024
Code Security Vulnerability Repair Using Reinforcement Learning with Large Language Models Nafis Tanveer Islam Mohammad Bahrami Karkevandi Peyman Najafirad 105 8 0 13 Jan 2024
Open Models, Closed Minds? On Agents Capabilities in Mimicking Human Personalities through Open Large Language Models Lucio La Cava Andrea Tagarelli LLMAG AI4CE 140 17 0 13 Jan 2024
Fine-grained Hallucination Detection and Editing for Language Models Abhika Mishra Akari Asai Vidhisha Balachandran Yizhong Wang Graham Neubig Yulia Tsvetkov Hannaneh Hajishirzi HILM 119 87 0 12 Jan 2024
Large Language Models Can Learn Temporal Reasoning Siheng Xiong Ali Payani Ramana Rao Kompella Faramarz Fekri LRM 127 97 0 12 Jan 2024
MAPO: Advancing Multilingual Reasoning through Multilingual Alignment-as-Preference Optimization Shuaijie She Wei Zou Shujian Huang Wenhao Zhu Xiang Liu Xiang Geng Jiajun Chen LRM 116 42 0 12 Jan 2024
Relying on the Unreliable: The Impact of Language Models' Reluctance to Express Uncertainty Kaitlyn Zhou Jena D. Hwang Xiang Ren Maarten Sap 96 68 0 12 Jan 2024
Reframing Tax Law Entailment as Analogical Reasoning Xinrui Zou Ming Zhang Nathaniel Weir Benjamin Van Durme Nils Holzenberger ELM 62 1 0 12 Jan 2024
An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models Gantavya Bhatt Yifang Chen Arnav M. Das Jifan Zhang Sang T. Truong ... Jeff Bilmes S. Du Kevin Jamieson Jordan T. Ash Robert D. Nowak 115 15 0 12 Jan 2024
Don't Rank, Combine! Combining Machine Translation Hypotheses Using Quality Estimation Giorgos Vernikos Andrei Popescu-Belis 89 15 0 12 Jan 2024
Experimental Contexts Can Facilitate Robust Semantic Property Inference in Language Models, but Inconsistently Kanishka Misra Allyson Ettinger Kyle Mahowald 93 5 0 12 Jan 2024