Title
LLaMA Beyond English: An Empirical Study on Language Capability Transfer Jun Zhao Zhihao Zhang Luhui Gao Qi Zhang Tao Gui Xuanjing Huang ELM 35 67 0 02 Jan 2024
If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents Ke Yang Jiateng Liu John Wu Chaoqi Yang Yi R. Fung ... Xu Cao Xingyao Wang Yiquan Wang Chenhui Xu Chengxiang Zhai LLMAG ELM 33 76 0 01 Jan 2024
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws Nikhil Sardana Jacob P. Portes Sasha Doubov Jonathan Frankle LRM 251 73 0 31 Dec 2023
Olapa-MCoT: Enhancing the Chinese Mathematical Reasoning Capability of LLMs Shaojie Zhu Zhaobin Wang Chengxiang Zhuo Hui Lu Bo Hu Zang Li LRM 35 0 0 29 Dec 2023
Exploring the Sensitivity of LLMs' Decision-Making Capabilities: Insights from Prompt Variation and Hyperparameters Manikanta Loya Divya Sinha Richard Futrell 23 35 0 29 Dec 2023
Structured Packing in LLM Training Improves Long Context Utilization Konrad Staniszewski Szymon Tworkowski Sebastian Jaszczur Yu Zhao Henryk Michalewski Lukasz Kuciñski Piotr Milo's 41 13 0 28 Dec 2023
MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation Zhongshen Zeng Pengguang Chen Shu Liu Haiyun Jiang Jiaya Jia ReLM ELM LRM 41 18 0 28 Dec 2023
Improving In-context Learning via Bidirectional Alignment Chengwei Qin Wenhan Xia Fangkai Jiao Chen Chen Yuchen Hu Bosheng Ding Shafiq Joty 43 7 0 28 Dec 2023
Task Contamination: Language Models May Not Be Few-Shot Anymore Changmao Li Jeffrey Flanigan 103 96 0 26 Dec 2023
From Text to Multimodal: A Comprehensive Survey of Adversarial Example Generation in Question Answering Systems Gulsum Yigit M. Amasyalı AAML 27 0 0 26 Dec 2023
Prompt-Propose-Verify: A Reliable Hand-Object-Interaction Data Generation Framework using Foundational Models Gurusha Juneja Sukrit Kumar DiffM 22 0 0 23 Dec 2023
SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling Dahyun Kim Chanjun Park Sanghoon Kim Wonsung Lee Wonho Song ... Hyunbyung Park Gyoungjin Gim Mikyoung Cha Hwalsuk Lee Sunghun Kim ALM ELM 35 136 0 23 Dec 2023
NPHardEval: Dynamic Benchmark on Reasoning Ability of Large Language Models via Complexity Classes Lizhou Fan Wenyue Hua Lingyao Li Haoyang Ling Yongfeng Zhang LRM 31 46 0 22 Dec 2023
Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning Filippos Christianos Georgios Papoudakis Matthieu Zimmer Thomas Coste Zhihao Wu ... Yicheng Luo Jianye Hao Kun Shao Haitham Bou-Ammar Jun Wang 35 19 0 22 Dec 2023
Assessing the Impact of Prompting Methods on ChatGPT's Mathematical Capabilities Yuhao Chen Chloe Wong Hanwen Yang Juan Aguenza Sai Bhujangari ... Eric Phuong Minghao Liu Raja Kumar Vanshika Vats James Davis 37 1 0 22 Dec 2023
YAYI 2: Multilingual Open-Source Large Language Models Yin Luo Qingchao Kong Nan Xu Jia Cao Bao Hao ... Zhaoxin Yu Zhengda Luo Wenji Mao Lei Wang Dajun Zeng ALM OSLM 51 7 0 22 Dec 2023
Turning Dust into Gold: Distilling Complex Reasoning Capabilities from LLMs by Leveraging Negative Data Yiwei Li Peiwen Yuan Shaoxiong Feng Boyuan Pan Bin Sun Xinglin Wang Heda Wang Kan Li LRM 37 21 0 20 Dec 2023
GeomVerse: A Systematic Evaluation of Large Models for Geometric Reasoning Mehran Kazemi Hamidreza Alvari Ankit Anand Jialin Wu Xi Chen Radu Soricut LRM ReLM 39 55 0 19 Dec 2023
Assessing Logical Reasoning Capabilities of Encoder-Only Transformer Models Paulo Pirozelli M. M. José Paulo de Tarso P. Filho A. Brandão Fabio Gagliardi Cozman LRM ELM 49 2 0 18 Dec 2023
Designing LLM Chains by Adapting Techniques from Crowdsourcing Workflows Madeleine Grunde-McLaughlin Michelle S. Lam Ranjay Krishna Daniel S. Weld Jeffrey Heer AI4CE 61 21 0 18 Dec 2023
Cascade Speculative Drafting for Even Faster LLM Inference Ziyi Chen Xiaocong Yang Jiacheng Lin Chenkai Sun Kevin Chen-Chuan Chang Jie Huang LRM 27 48 0 18 Dec 2023
An In-depth Look at Gemini's Language Abilities Syeda Nahida Akter Zichun Yu Aashiq Muhamed Tianyue Ou Alex Bäuerle Ángel Alexander Cabrera Krish Dholakia Chenyan Xiong Graham Neubig LRM ELM 41 35 0 18 Dec 2023
Social Learning: Towards Collaborative Learning with Large Language Models Amirkeivan Mohtashami Florian Hartmann Sian Gooding Lukás Zilka Matt Sharifi Blaise Agüera y Arcas 16 10 0 18 Dec 2023
G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model Jiahui Gao Renjie Pi Jipeng Zhang Jiacheng Ye Wanjun Zhong ... Lanqing Hong Jianhua Han Hang Xu Zhenguo Li Lingpeng Kong SyDa ReLM LRM 52 97 0 18 Dec 2023
Retrieval-Augmented Generation for Large Language Models: A Survey Yunfan Gao Yun Xiong Xinyu Gao Kangxiang Jia Jinliu Pan Yuxi Bi Yi Dai Jiawei Sun Meng Wang Haofen Wang 3DV RALM 66 1,572 1 18 Dec 2023
From Good to Great: Improving Math Reasoning with Tool-Augmented Interleaf Prompting Nuo Chen Hongguang Li Baoyuan Wang Jia Li RALM ReLM LRM 28 7 0 18 Dec 2023
Distinguishing Translations by Human, NMT, and ChatGPT: A Linguistic and Statistical Approach Zhaokun Jiang Qianxi Lv Ziyin Zhang 29 1 0 17 Dec 2023
Mixed Distillation Helps Smaller Language Model Better Reasoning Chenglin Li Qianglong Chen Liangyue Li Wang Caiyu Yicheng Li Zhang Yin Yin Zhang LRM 46 12 0 17 Dec 2023
Do LLMs Work on Charts? Designing Few-Shot Prompts for Chart Question Answering and Summarization Do Xuan Long Mohammad Hassanpour Ahmed Masry P. Kavehzadeh Enamul Hoque Shafiq Joty LRM 30 9 0 17 Dec 2023
TinyGSM: achieving >80% on GSM8k with small language models Bingbin Liu Sébastien Bubeck Ronen Eldan Janardhan Kulkarni Yuanzhi Li Anh Nguyen Rachel A. Ward Yi Zhang ALM 32 47 0 14 Dec 2023
Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations Peiyi Wang Lei Li Zhihong Shao R. X. Xu Damai Dai Yifei Li Deli Chen Y.Wu Zhifang Sui AIMat LRM ALM 53 279 0 14 Dec 2023
Fewer is More: Boosting LLM Reasoning with Reinforced Context Pruning Xijie Huang Li Lyna Zhang Kwang-Ting Cheng Fan Yang Mao Yang LRM ReLM 37 8 0 14 Dec 2023
Zebra: Extending Context Window with Layerwise Grouped Local-Global Attention Kaiqiang Song Xiaoyang Wang Sangwoo Cho Xiaoman Pan Dong Yu 44 7 0 14 Dec 2023
Look Before You Leap: A Universal Emergent Decomposition of Retrieval Tasks in Language Models Alexandre Variengien Eric Winsor LRM ReLM 94 10 0 13 Dec 2023
AI capabilities can be significantly improved without expensive retraining Tom Davidson Jean-Stanislas Denain Pablo Villalobos Guillem Bas OffRL VLM 26 26 0 12 Dec 2023
ComplexityNet: Increasing LLM Inference Efficiency by Learning Task Complexity Henry Bae Aghyad Deeb Alex Fleury Kehang Zhu 25 2 0 12 Dec 2023
Get an A in Math: Progressive Rectification Prompting Zhenyu Wu Meng Jiang Chao Shen KELM LRM 40 9 0 11 Dec 2023
Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models Avi Singh John D. Co-Reyes Rishabh Agarwal Ankesh Anand Piyush Patil ... Yamini Bansal Ethan Dyer Behnam Neyshabur Jascha Narain Sohl-Dickstein Noah Fiedel ALM LRM ReLM SyDa 157 152 0 11 Dec 2023
Frugal LMs Trained to Invoke Symbolic Solvers Achieve Parameter-Efficient Arithmetic Reasoning Subhabrata Dutta Joykirat Singh Ishan Pandey Sunny Manchanda Soumen Chakrabarti Tanmoy Chakraborty ReLM LRM 31 4 0 09 Dec 2023
PathFinder: Guided Search over Multi-Step Reasoning Paths O. Yu. Golovneva Sean O'Brien Ramakanth Pasunuru Tianlu Wang Luke Zettlemoyer Maryam Fazel-Zarandi Asli Celikyilmaz LRM 35 7 0 08 Dec 2023
Latent Skill Discovery for Chain-of-Thought Reasoning Zifan Xu Haozhu Wang Dmitriy Bespalov Peter Stone Yanjun Qi ReLM LRM 59 2 0 07 Dec 2023
Chain of Code: Reasoning with a Language Model-Augmented Code Emulator Chengshu Li Jacky Liang Andy Zeng Xinyun Chen Karol Hausman Dorsa Sadigh Sergey Levine Fei-Fei Li Fei Xia Brian Ichter LLMAG LRM 36 72 0 07 Dec 2023
Is Bigger and Deeper Always Better? Probing LLaMA Across Scales and Layers Nuo Chen Ning Wu Shining Liang Ming Gong Linjun Shou Dongmei Zhang Jia Li LRM 27 10 0 07 Dec 2023
Inherent limitations of LLMs regarding spatial information He Yan Xinyao Hu Xiangpeng Wan Chengyu Huang Kai Zou Shiqi Xu LRM 36 2 0 05 Dec 2023
Prompt Optimization via Adversarial In-Context Learning Do Xuan Long Yiran Zhao Hannah Brown Yuxi Xie James Xu Zhao Nancy F. Chen Kenji Kawaguchi Michael Qizhe Xie Junxian He 85 12 0 05 Dec 2023
Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph Construction Hongbin Ye Honghao Gui Aijia Zhang Tong Liu Wei Hua Weiqiang Jia LLMAG 40 5 0 05 Dec 2023
Competition-Level Problems are Effective LLM Evaluators Yiming Huang Zheng-Wen Lin Xiao Liu Yeyun Gong Shuai Lu ... Yaobo Liang Yelong Shen Chen Lin Nan Duan Weizhu Chen ELM LRM 35 26 0 04 Dec 2023
Magicoder: Empowering Code Generation with OSS-Instruct Yuxiang Wei Zhe Wang Jiawei Liu Yifeng Ding Lingming Zhang SyDa 45 99 0 04 Dec 2023
Exchange-of-Thought: Enhancing Large Language Model Capabilities through Cross-Model Communication Zhangyue Yin Qiushi Sun Cheng Chang Qipeng Guo Junqi Dai Xuanjing Huang Xipeng Qiu LRM 56 50 0 04 Dec 2023
Jellyfish: A Large Language Model for Data Preprocessing Haochen Zhang Yuyang Dong Chuan Xiao Masafumi Oyamada 48 26 0 04 Dec 2023