Policy Guided Tree Search for Enhanced LLM Reasoning

4 February 2025

Papers citing "Policy Guided Tree Search for Enhanced LLM Reasoning"

18 / 18 papers shown

Title
Monte Carlo Tree Search based Space Transfer for Black-box Optimization Shukuan Wang Ke Xue Lei Song Xiaobin Huang Chao Qian 92 1 0 10 Dec 2024
Interpretable Contrastive Monte Carlo Tree Search Reasoning Zitian Gao Boye Niu Xuzheng He Haotian Xu Hongzhang Liu Aiwei Liu Xuming Hu Lijie Wen LRM 96 30 0 02 Oct 2024
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters Charlie Snell Jaehoon Lee Kelvin Xu Aviral Kumar LRM 102 576 0 06 Aug 2024
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking E. Zelikman Georges Harik Yijia Shao Varuna Jayasiri Nick Haber Noah D. Goodman LLMAG ReLM LRM 80 131 0 14 Mar 2024
Can Large Language Models Reason and Plan? Subbarao Kambhampati LRM 34 73 0 07 Mar 2024
GLoRe: When, Where, and How to Improve LLM Reasoning via Global and Local Refinements Alex Havrilla Sharath Raparthy Christoforus Nalmpantis Jane Dwivedi-Yu Maksym Zhuravinskyi Eric Hambro Roberta Railneau ReLM LRM 47 56 0 13 Feb 2024
Chain of Code: Reasoning with a Language Model-Augmented Code Emulator Chengshu Li Jacky Liang Andy Zeng Xinyun Chen Karol Hausman Dorsa Sadigh Sergey Levine Fei-Fei Li Fei Xia Brian Ichter LLMAG LRM 51 80 0 07 Dec 2023
Graph of Thoughts: Solving Elaborate Problems with Large Language Models Maciej Besta Nils Blach Aleš Kubíček Robert Gerstenberger Michal Podstawski ... Joanna Gajda Tomasz Lehmann H. Niewiadomski Piotr Nyczyk Torsten Hoefler LRM AI4CE LM&Ro 75 640 0 18 Aug 2023
Reasoning with Language Model is Planning with World Model Shibo Hao Yi Gu Haodi Ma Joshua Jiahua Hong Zhen Wang D. Wang Zhiting Hu ReLM LRM LLMAG 89 539 0 24 May 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 410 13,788 0 15 Mar 2023
Automatic Chain of Thought Prompting in Large Language Models Zhuosheng Zhang Aston Zhang Mu Li Alexander J. Smola ReLM LRM 105 603 0 07 Oct 2022
Recipe for a General, Powerful, Scalable Graph Transformer Ladislav Rampášek Mikhail Galkin Vijay Prakash Dwivedi Anh Tuan Luu Guy Wolf Dominique Beaini 102 549 0 25 May 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 567 9,009 0 28 Jan 2022
Understanding over-squashing and bottlenecks on graphs via curvature Jake Topping Francesco Di Giovanni B. Chamberlain Xiaowen Dong M. Bronstein 87 437 0 29 Nov 2021
Rethinking Graph Transformers with Spectral Attention Devin Kreuzer Dominique Beaini William L. Hamilton Vincent Létourneau Prudencio Tossou 62 525 0 07 Jun 2021
On the Bottleneck of Graph Neural Networks and its Practical Implications Uri Alon Eran Yahav GNN 77 675 0 09 Jun 2020
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 203 18,685 0 20 Jul 2017
Program Induction by Rationale Generation : Learning to Solve and Explain Algebraic Word Problems Wang Ling Dani Yogatama Chris Dyer Phil Blunsom AIMat 49 701 0 11 May 2017