Title
Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical Reasoning Pan Lu Liang Qiu Kai-Wei Chang Ying Nian Wu Song-Chun Zhu Tanmay Rajpurohit Peter Clark Ashwin Kalyan ReLM LRM 61 269 0 29 Sep 2022
Faithful Reasoning Using Large Language Models Antonia Creswell Murray Shanahan ReLM LRM 29 123 0 30 Aug 2022
Diverse Title Generation for Stack Overflow Posts with Multiple Sampling Enhanced Transformer Fengji Zhang Jin Liu Yao Wan Xiao Yu Xiao Liu J. Keung 96 11 0 24 Aug 2022
Induced Natural Language Rationales and Interleaved Markup Tokens Enable Extrapolation in Large Language Models M. Bueno Carlos Gemmel Jeffrey Stephen Dalton R. Lotufo Rodrigo Nogueira LRM 49 12 0 24 Aug 2022
Limitations of Language Models in Arithmetic and Symbolic Induction Jingu Qian Hong Wang Zekun Li Shiyang Li Xifeng Yan ReLM LRM 45 74 0 09 Aug 2022
Language Models Can Teach Themselves to Program Better Patrick M. Haluptzok Matthew Bowers Adam Tauman Kalai ReLM SyDa LRM 19 81 0 29 Jul 2022
An Interpretability Evaluation Benchmark for Pre-trained Language Models Ya-Ming Shen Lijie Wang Ying-Cong Chen Xinyan Xiao Jing Liu Hua Wu 42 4 0 28 Jul 2022
CodeT: Code Generation with Generated Tests Bei Chen Fengji Zhang A. Nguyen Daoguang Zan Zeqi Lin Jian-Guang Lou Weizhu Chen 48 320 0 21 Jul 2022
Language Model Cascades David Dohan Winnie Xu Aitor Lewkowycz Jacob Austin David Bieber ... Henryk Michalewski Rif A. Saurous Jascha Narain Sohl-Dickstein Kevin Patrick Murphy Charles Sutton ReLM LRM 38 101 0 21 Jul 2022
Can large language models reason about medical questions? Valentin Liévin C. Hother Andreas Geert Motzfeldt Ole Winther ELM LM&MA AI4MH LRM 31 300 0 17 Jul 2022
Language models show human-like content effects on reasoning tasks Ishita Dasgupta Andrew Kyle Lampinen Stephanie C. Y. Chan Hannah R. Sheahan Antonia Creswell D. Kumaran James L. McClelland Felix Hill ReLM LRM 35 181 0 14 Jul 2022
Language Models (Mostly) Know What They Know Saurav Kadavath Tom Conerly Amanda Askell T. Henighan Dawn Drain ... Nicholas Joseph Benjamin Mann Sam McCandlish C. Olah Jared Kaplan ELM 61 722 0 11 Jul 2022
CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Guosheng Lin SyDa ALM 135 243 0 05 Jul 2022
Rationale-Augmented Ensembles in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Denny Zhou ReLM LRM 45 124 0 02 Jul 2022
Forecasting Future World Events with Neural Networks Andy Zou Tristan Xiao Ryan Jia Joe Kwon Mantas Mazeika Richard Li Dawn Song Jacob Steinhardt Owain Evans Dan Hendrycks 30 22 0 30 Jun 2022
Solving Quantitative Reasoning Problems with Language Models Aitor Lewkowycz Anders Andreassen David Dohan Ethan Dyer Henryk Michalewski ... Theo Gutman-Solo Yuhuai Wu Behnam Neyshabur Guy Gur-Ari Vedant Misra ReLM ELM LRM 90 761 0 29 Jun 2022
Joint Generator-Ranker Learning for Natural Language Generation Weizhou Shen Yeyun Gong Yelong Shen Song Wang Xiaojun Quan Nan Duan Weizhu Chen 42 5 0 28 Jun 2022
PlanBench: An Extensible Benchmark for Evaluating Large Language Models on Planning and Reasoning about Change Karthik Valmeekam Matthew Marquez Alberto Olmo S. Sreedharan Subbarao Kambhampati ReLM LRM 30 202 0 21 Jun 2022
Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation Shengyao Zhuang Houxing Ren Linjun Shou Jian Pei Ming Gong Guido Zuccon Daxin Jiang 47 65 0 21 Jun 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 96 2,371 0 15 Jun 2022
LIFT: Language-Interfaced Fine-Tuning for Non-Language Machine Learning Tasks Tuan Dinh Yuchen Zeng Ruisu Zhang Ziqian Lin Michael Gira Shashank Rajput Jy-yong Sohn Dimitris Papailiopoulos Kangwook Lee LMTD 50 128 0 14 Jun 2022
Making Large Language Models Better Reasoners with Step-Aware Verifier Yifei Li Zeqi Lin Shizhuo Zhang Qiang Fu B. Chen Jian-Guang Lou Weizhu Chen ReLM LRM 40 212 0 06 Jun 2022
Fault-Aware Neural Code Rankers J. Inala Chenglong Wang Mei Yang Andrés Codas Mark Encarnación Shuvendu K. Lahiri Madan Musuvathi Jianfeng Gao ALM 24 42 0 04 Jun 2022
MultiHiertt: Numerical Reasoning over Multi Hierarchical Tabular and Textual Data Yilun Zhao Yunxiang Li Chenying Li Rui Zhang AIMat 39 97 0 03 Jun 2022
Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search Michał Zawalski Michał Tyrolski K. Czechowski Tomasz Odrzygó'zd'z Damian Stachura Piotr Pikekos Yuhuai Wu Lukasz Kuciñski Piotr Milo's LRM 21 9 0 01 Jun 2022
Why are NLP Models Fumbling at Elementary Math? A Survey of Deep Learning based Word Problem Solvers Sowmya S. Sundaram Sairam Gurajada M. Fisichella Deepak P Savitha Sam Abraham ReLM 29 11 0 31 May 2022
A Survey in Mathematical Language Processing Jordan Meadows André Freitas AIMat 27 15 0 30 May 2022
Learning Math Reasoning from Self-Sampled Correct and Partially-Correct Solutions Ansong Ni J. Inala Chenglong Wang Oleksandr Polozov Christopher Meek Dragomir R. Radev Jianfeng Gao ReLM AIMat LRM 24 42 0 28 May 2022
NaturalProver: Grounded Mathematical Proof Generation with Language Models Sean Welleck Jiacheng Liu Ximing Lu Hannaneh Hajishirzi Yejin Choi AIMat LRM 32 66 0 25 May 2022
Autoformalization with Large Language Models Yuhuai Wu Albert Q. Jiang Wenda Li M. Rabe Charles Staats M. Jamnik Christian Szegedy AI4CE 112 160 0 25 May 2022
Generating Natural Language Proofs with Verifier-Guided Search Kaiyu Yang Jia Deng Danqi Chen LRM 33 69 0 25 May 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 331 4,077 0 24 May 2022
Maieutic Prompting: Logically Consistent Reasoning with Recursive Explanations Jaehun Jung Lianhui Qin Sean Welleck Faeze Brahman Chandra Bhagavatula Ronan Le Bras Yejin Choi ReLM LRM 229 190 0 24 May 2022
Chain of Thought Imitation with Procedure Cloning Mengjiao Yang Dale Schuurmans Pieter Abbeel Ofir Nachum OffRL 35 30 0 22 May 2022
Least-to-Most Prompting Enables Complex Reasoning in Large Language Models Denny Zhou Nathanael Scharli Le Hou Jason W. Wei Nathan Scales ... Dale Schuurmans Claire Cui Olivier Bousquet Quoc Le Ed H. Chi RALM LRM AI4CE 27 1,057 0 21 May 2022
Selection-Inference: Exploiting Large Language Models for Interpretable Logical Reasoning Antonia Creswell Murray Shanahan I. Higgins ReLM LRM 39 347 0 19 May 2022
LogiGAN: Learning Logical Reasoning via Adversarial Pre-training Xinyu Pi Wanjun Zhong Yan Gao Nan Duan Jian-Guang Lou NAI GAN LRM AI4CE 46 16 0 18 May 2022
LogicSolver: Towards Interpretable Math Word Problem Solving with Logical Prompt-enhanced Learning Zhicheng YANG Jinghui Qin Jiaqi Chen Liang Lin Xiaodan Liang ReLM LRM 40 31 0 17 May 2022
Structured, flexible, and robust: benchmarking and improving large language models towards more human-like behavior in out-of-distribution reasoning tasks Katherine M. Collins Catherine Wong Jiahai Feng Megan Wei J. Tenenbaum LRM 33 58 0 11 May 2022
UL2: Unifying Language Learning Paradigms Yi Tay Mostafa Dehghani Vinh Q. Tran Xavier Garcia Jason W. Wei ... Tal Schuster H. Zheng Denny Zhou N. Houlsby Donald Metzler AI4CE 74 298 0 10 May 2022
Towards Teachable Reasoning Systems: Using a Dynamic Memory of User Feedback for Continual System Improvement Bhavana Dalvi Oyvind Tafjord Peter Clark LRM KELM ReLM 40 37 0 27 Apr 2022
Generalized Quantifiers as a Source of Error in Multilingual NLU Benchmarks Ruixiang Cui Daniel Hershcovich Anders Søgaard 30 13 0 22 Apr 2022
PaLM: Scaling Language Modeling with Pathways Aakanksha Chowdhery Sharan Narang Jacob Devlin Maarten Bosma Gaurav Mishra ... Kathy Meier-Hellstern Douglas Eck J. Dean Slav Petrov Noah Fiedel PILM LRM 162 6,035 0 05 Apr 2022
LogicInference: A New Dataset for Teaching Logical Inference to seq2seq Models Santiago Ontanon Joshua Ainslie Vaclav Cvicek Zachary Kenneth Fisher NAI ReLM LRM 27 13 0 28 Mar 2022
STaR: Bootstrapping Reasoning With Reasoning E. Zelikman Yuhuai Wu Jesse Mu Noah D. Goodman ReLM LRM 44 439 0 28 Mar 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 355 3,338 0 21 Mar 2022
Teaching language models to support answers with verified quotes Jacob Menick Maja Trebacz Vladimir Mikulik John Aslanides Francis Song ... Mia Glaese Susannah Young Lucy Campbell-Gillingham G. Irving Nat McAleese ELM RALM 251 259 0 21 Mar 2022
Memorizing Transformers Yuhuai Wu M. Rabe DeLesley S. Hutchins Christian Szegedy RALM 30 173 0 16 Mar 2022
Capturing Failures of Large Language Models via Human Cognitive Biases Erik Jones Jacob Steinhardt 36 92 0 24 Feb 2022
GPT-based Open-Ended Knowledge Tracing Naiming Liu Zichao Wang Richard G. Baraniuk Andrew Lan AI4Ed 32 3 0 21 Feb 2022