Belief in the Machine: Investigating Epistemological Blind Spots of Language Models

28 October 2024

Papers citing "Belief in the Machine: Investigating Epistemological Blind Spots of Language Models"

28 / 28 papers shown

Title
Financial Statement Analysis with Large Language Models Alex G. Kim Maximilian Muhn Valeri V. Nikolaev AIFin 105 27 0 24 Feb 2025
Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise Rose E. Wang Ana T. Ribeiro Carly Robinson Susanna Loeb Dora Demszky 156 17 0 28 Jan 2025
Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools Varun Magesh Faiz Surani Matthew Dahl Mirac Suzgun Christopher D. Manning Daniel E. Ho HILM ELM AILaw 68 79 0 30 May 2024
ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models Jinheon Baek S. Jauhar Silviu Cucerzan Sung Ju Hwang AI4CE LLMAG LM&Ro 106 55 0 11 Apr 2024
OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models Hainiu Xu Runcong Zhao Lixing Zhu Bin Liang Yulan He 147 25 0 08 Feb 2024
Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding Mirac Suzgun Adam Tauman Kalai KELM LRM LLMAG ReLM 106 78 0 23 Jan 2024
Mixtral of Experts Albert Q. Jiang Alexandre Sablayrolles Antoine Roux A. Mensch Blanche Savary ... Théophile Gervet Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LLMAG 164 1,123 0 08 Jan 2024
Large Legal Fictions: Profiling Legal Hallucinations in Large Language Models Matthew Dahl Varun Magesh Mirac Suzgun Daniel E. Ho HILM AILaw 110 85 0 02 Jan 2024
Improving Interpersonal Communication by Simulating Audiences with Language Models Ryan Liu Howard Yen Raja Marjieh Thomas Griffiths Ranjay Krishna 45 12 0 01 Nov 2023
How FaR Are Large Language Models From Agents with Theory-of-Mind? Pei Zhou Aman Madaan Srividya Pranavi Potharaju Aditya Gupta Kevin R. McKee ... Xiang Ren Swaroop Mishra Aida Nematzadeh Shyam Upadhyay Manaal Faruqui LRM AI4CE 81 52 0 04 Oct 2023
Understanding Social Reasoning in Language Models with Language Models Kanishk Gandhi Jan-Philipp Fränken Tobias Gerstenberg Noah D. Goodman LRM 74 126 0 21 Jun 2023
Simple Linguistic Inferences of Large Language Models (LLMs): Blind Spots and Blinds Victoria Basmov Yoav Goldberg Reut Tsarfaty ReLM LRM 61 6 0 24 May 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.5K 14,761 0 15 Mar 2023
Benchmarks for Automated Commonsense Reasoning: A Survey E. Davis ELM LRM 74 63 0 09 Feb 2023
Large Language Models Encode Clinical Knowledge K. Singhal Shekoofeh Azizi T. Tu S. S. Mahdavi Jason W. Wei ... A. Rajkomar Joelle Barral Christopher Semturs Alan Karthikesalingam Vivek Natarajan LM&MA ELM AI4MH 164 2,381 0 26 Dec 2022
Large Language Models Struggle to Learn Long-Tail Knowledge Nikhil Kandpal H. Deng Adam Roberts Eric Wallace Colin Raffel RALM KELM 131 419 0 15 Nov 2022
Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding Mirac Suzgun Luke Melas-Kyriazi Dan Jurafsky 72 45 0 14 Nov 2022
Scaling Instruction-Finetuned Language Models Hyung Won Chung Le Hou Shayne Longpre Barret Zoph Yi Tay ... Jacob Devlin Adam Roberts Denny Zhou Quoc V. Le Jason W. Wei ReLM LRM 234 3,158 0 20 Oct 2022
Challenging BIG-Bench Tasks and Whether Chain-of-Thought Can Solve Them Mirac Suzgun Nathan Scales Nathanael Scharli Sebastian Gehrmann Yi Tay ... Aakanksha Chowdhery Quoc V. Le Ed H. Chi Denny Zhou Jason W. Wei ALM ELM LRM ReLM 271 1,142 0 17 Oct 2022
Do Large Language Models know what humans know? Sean Trott Cameron J. Jones Tyler A. Chang J. Michaelov Benjamin Bergen 64 95 0 04 Sep 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 292 2,521 0 15 Jun 2022
Selection-Inference: Exploiting Large Language Models for Interpretable Logical Reasoning Antonia Creswell Murray Shanahan I. Higgins ReLM LRM 112 364 0 19 May 2022
Mind the gap: Challenges of deep learning approaches to Theory of Mind Jaan Aru Aqeel Labash Oriol Corcoll Raul Vicente 86 26 0 30 Mar 2022
Commonsense Knowledge Reasoning and Generation with Pre-trained Language Models: A Survey Prajjwal Bhargava Vincent Ng ReLM LRM 128 63 0 28 Jan 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 855 9,714 0 28 Jan 2022
Do Prompt-Based Models Really Understand the Meaning of their Prompts? Albert Webson Ellie Pavlick LRM 113 374 0 02 Sep 2021
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 904 42,463 0 28 May 2020
CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge Alon Talmor Jonathan Herzig Nicholas Lourie Jonathan Berant RALM 146 1,754 0 02 Nov 2018