Title
Show Me How It's Done: The Role of Explanations in Fine-Tuning Language Models Mohamad Ballout U. Krumnack Gunther Heidemann Kai-Uwe Kuehnberger LRM 32 3 0 12 Feb 2024
Natural Language Reinforcement Learning Xidong Feng Bo Liu Mengyue Yang Ziyan Wang Girish A. Koushiks Yali Du Ying Wen Jun Wang OffRL 40 3 0 11 Feb 2024
OpenFedLLM: Training Large Language Models on Decentralized Private Data via Federated Learning Rui Ye Wenhao Wang Jingyi Chai Dihan Li Zexi Li Yinda Xu Yaxin Du Yanfeng Wang Siheng Chen ALM FedML AIFin 16 79 0 10 Feb 2024
Whispers in the Machine: Confidentiality in LLM-integrated Systems Jonathan Evertz Merlin Chlosta Lea Schonherr Thorsten Eisenhofer 79 17 0 10 Feb 2024
Generating Chain-of-Thoughts with a Pairwise-Comparison Approach to Searching for the Most Promising Intermediate Thought Zhen-Yu Zhang Siwei Han Huaxiu Yao Gang Niu Masashi Sugiyama LLMAG LRM 19 2 0 10 Feb 2024
The Unreasonable Effectiveness of Eccentric Automatic Prompts Rick Battle Teja Gollapudi LRM ReLM 42 10 0 09 Feb 2024
NICE: To Optimize In-Context Examples or Not? Pragya Srivastava Satvik Golechha Amit Deshpande Amit Sharma 30 6 0 09 Feb 2024
V-STaR: Training Verifiers for Self-Taught Reasoners Arian Hosseini Xingdi Yuan Nikolay Malkin Rameswar Panda Alessandro Sordoni Rishabh Agarwal ReLM LRM 54 106 0 09 Feb 2024
InternLM-Math: Open Math Large Language Models Toward Verifiable Reasoning Huaiyuan Ying Shuo Zhang Linyang Li Zhejian Zhou Yunfan Shao ... Hang Yan Xipeng Qiu Jiayu Wang Kai-xiang Chen Dahua Lin ReLM LRM 42 71 0 09 Feb 2024
CultureLLM: Incorporating Cultural Differences into Large Language Models Cheng-rong Li Mengzhou Chen Jindong Wang Sunayana Sitaram Xing Xie VLM 56 18 0 09 Feb 2024
Large Language Models: A Survey Shervin Minaee Tomas Mikolov Narjes Nikzad M. Asgari-Chenaghlu R. Socher Xavier Amatriain Jianfeng Gao ALM LM&MA ELM 134 377 0 09 Feb 2024
Rethinking Data Selection for Supervised Fine-Tuning Ming Shen 34 17 0 08 Feb 2024
On the Convergence of Zeroth-Order Federated Tuning for Large Language Models Zhenqing Ling Daoyuan Chen Liuyi Yao Yaliang Li Ying Shen FedML 54 12 0 08 Feb 2024
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning Zhiheng Xi Wenxiang Chen Boyang Hong Senjie Jin Rui Zheng ... Xinbo Zhang Peng Sun Tao Gui Qi Zhang Xuanjing Huang LRM 42 22 0 08 Feb 2024
Limits of Transformer Language Models on Learning to Compose Algorithms Jonathan Thomm Aleksandar Terzić Giacomo Camposampiero Michael Hersche Bernhard Schölkopf Abbas Rahimi 44 3 0 08 Feb 2024
In-Context Learning Can Re-learn Forbidden Tasks Sophie Xhonneux David Dobre Jian Tang Gauthier Gidel Dhanya Sridhar 27 3 0 08 Feb 2024
Pretrained Generative Language Models as General Learning Frameworks for Sequence-Based Tasks Ben Fauber 32 2 0 08 Feb 2024
In-Context Principle Learning from Mistakes Tianjun Zhang Aman Madaan Luyu Gao Steven Zheng Swaroop Mishra Yiming Yang Niket Tandon Uri Alon KELM ReLM 38 24 0 08 Feb 2024
Zero-Shot Chain-of-Thought Reasoning Guided by Evolutionary Algorithms in Large Language Models Feihu Jin Yifan Liu Ying Tan LRM ReLM LLMAG 25 11 0 08 Feb 2024
SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models Lijun Li Bowen Dong Ruohui Wang Xuhao Hu Wangmeng Zuo Dahua Lin Yu Qiao Jing Shao ELM 30 88 0 07 Feb 2024
Pedagogical Alignment of Large Language Models Shashank Sonkar Kangqi Ni Sapana Chaudhary Richard G. Baraniuk AI4Ed 18 7 0 07 Feb 2024
Guiding LLMs The Right Way: Fast, Non-Invasive Constrained Generation Luca Beurer-Kellner Marc Fischer Martin Vechev 44 38 0 07 Feb 2024
ApiQ: Finetuning of 2-Bit Quantized Large Language Model Baohao Liao Christian Herold Shahram Khadivi Christof Monz CLL MQ 55 12 0 07 Feb 2024
Dual-View Visual Contextualization for Web Navigation Jihyung Kil Chan Hee Song Boyuan Zheng Xiang Deng Yu-Chuan Su Wei-Lun Chao EgoV 22 12 0 06 Feb 2024
LESS: Selecting Influential Data for Targeted Instruction Tuning Mengzhou Xia Sadhika Malladi Suchin Gururangan Sanjeev Arora Danqi Chen 91 195 0 06 Feb 2024
Discovery of the Hidden World with Large Language Models Chenxi Liu Yongqiang Chen Tongliang Liu Biwei Huang James Cheng Bo Han Kun Zhang CML 65 10 0 06 Feb 2024
Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language Models Spyridon Mouselinos Henryk Michalewski Mateusz Malinowski LRM 39 5 0 06 Feb 2024
RevOrder: A Novel Method for Enhanced Arithmetic in Language Models Si Shen Peijun Shen Danhao Zhu MU 41 1 0 06 Feb 2024
ReLU $^2$ Wins: Discovering Efficient Activation Functions for Sparse LLMs Zhengyan Zhang Yixin Song Guanghui Yu Xu Han Yankai Lin Chaojun Xiao Chenyang Song Zhiyuan Liu Zeyu Mi Maosong Sun 27 31 0 06 Feb 2024
Self-Discover: Large Language Models Self-Compose Reasoning Structures Pei Zhou Jay Pujara Xiang Ren Xinyun Chen Heng-Tze Cheng Quoc V. Le Ed H. Chi Denny Zhou Swaroop Mishra Huaixiu Steven Zheng LRM ReLM 29 48 0 06 Feb 2024
Nevermind: Instruction Override and Moderation in Large Language Models Edward Kim ALM 26 0 0 05 Feb 2024
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models Zhihong Shao Peiyi Wang Qihao Zhu Runxin Xu Jun-Mei Song ... Haowei Zhang Mingchuan Zhang Y. K. Li Yu-Huan Wu Daya Guo ReLM LRM 51 746 0 05 Feb 2024
Understanding Reasoning Ability of Language Models From the Perspective of Reasoning Paths Aggregation Xinyi Wang Alfonso Amayuelas Kexun Zhang Liangming Pan Wenhu Chen Wenjie Wang LRM 40 12 0 05 Feb 2024
CIDAR: Culturally Relevant Instruction Dataset For Arabic Zaid Alyafeai Khalid Almubarak Ahmed Ashraf Deema Alnuhait Saied Alshahrani ... Qais Gawah Zead Saleh Mustafa Ghaleb Yousef Ali Maged S. Al-Shaibani 31 9 0 05 Feb 2024
User Centric Evaluation of Code Generation Tools Tanha Miah Hong Zhu ELM 31 3 0 05 Feb 2024
Evading Data Contamination Detection for Language Models is (too) Easy Jasper Dekoninck Mark Niklas Muller Maximilian Baader Marc Fischer Martin Vechev 111 18 0 05 Feb 2024
Learning from Teaching Regularization: Generalizable Correlations Should be Easy to Imitate Can Jin Tong Che Hongwu Peng Yiyuan Li Dimitris N. Metaxas Marco Pavone 49 44 0 05 Feb 2024
Multi-step Problem Solving Through a Verifier: An Empirical Analysis on Model-induced Process Supervision Zihan Wang Yunxuan Li Yuexin Wu Liangchen Luo Le Hou Hongkun Yu Jingbo Shang LRM 45 20 0 05 Feb 2024
Integration of cognitive tasks into artificial general intelligence test for large models Youzhi Qu Chen Wei Penghui Du Wenxin Che Chi Zhang ... Bin Hu Kai Du Haiyan Wu Jia Liu Quanying Liu ELM 34 7 0 04 Feb 2024
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model Xuanchang Zhang Zhuosheng Zhang Hai Zhao LRM ALM 27 2 0 04 Feb 2024
Diversity Measurement and Subset Selection for Instruction Tuning Datasets Peiqi Wang Songlin Yang Zhen Guo Matt Stallone Yoon Kim Polina Golland Yikang Shen 31 9 0 04 Feb 2024
FCoReBench: Can Large Language Models Solve Challenging First-Order Combinatorial Reasoning Problems? Chinmay Mittal Krishna Kartik Mausam Parag Singla LRM 49 4 0 04 Feb 2024
GliDe with a CaPE: A Low-Hassle Method to Accelerate Speculative Decoding Cunxiao Du Jing Jiang Yuanchen Xu Jiawei Wu Sicheng Yu ... Shenggui Li Kai Xu Liqiang Nie Zhaopeng Tu Yang You 42 30 0 03 Feb 2024
Break the Sequential Dependency of LLM Inference Using Lookahead Decoding Yichao Fu Peter Bailis Ion Stoica Hao Zhang 133 145 0 03 Feb 2024
More Agents Is All You Need Junyou Li Qin Zhang Yangbin Yu Qiang Fu Deheng Ye LLMAG 147 64 0 03 Feb 2024
The RL/LLM Taxonomy Tree: Reviewing Synergies Between Reinforcement Learning and Large Language Models M. Pternea Prerna Singh Abir Chakraborty Y. Oruganti M. Milletarí Sayli Bapat Kebei Jiang OffRL 36 7 0 02 Feb 2024
TravelPlanner: A Benchmark for Real-World Planning with Language Agents Jian Xie Kai Zhang Jiangjie Chen Tinghui Zhu Renze Lou Yuandong Tian Yanghua Xiao Yu-Chuan Su LLMAG LM&Ro 62 136 0 02 Feb 2024
MAGDi: Structured Distillation of Multi-Agent Interaction Graphs Improves Reasoning in Smaller Language Models Justin Chih-Yao Chen Swarnadeep Saha Elias Stengel-Eskin Mohit Bansal LRM LLMAG 39 16 0 02 Feb 2024
Foundation Model Sherpas: Guiding Foundation Models through Knowledge and Reasoning D. Bhattacharjya Junkyu Lee Don Joven Agravante Balaji Ganesan Radu Marinescu LLMAG 38 1 0 02 Feb 2024
Fractal Patterns May Illuminate the Success of Next-Token Prediction Ibrahim M. Alabdulmohsin Vinh Q. Tran Mostafa Dehghani 37 2 0 02 Feb 2024