The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

13 February 2025

Papers citing "The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding"

36 / 36 papers shown

Title
Exploring the Evolution of Physics Cognition in Video Generation: A Survey Minghui Lin Xiang Wang Yansen Wang Shu Wang Fengqi Dai ... Cunxiang Wang Zhengrong Zuo Nong Sang Siteng Huang Donglin Wang EGVM VGen 135 4 0 27 Mar 2025
How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites Zhe Chen Weiyun Wang Hao Tian Shenglong Ye Zhangwei Gao ... Tong Lu Dahua Lin Yu Qiao Jifeng Dai Wenhai Wang MLLM VLM 93 604 0 25 Apr 2024
Can LLMs Understand Computer Networks? Towards a Virtual System Administrator Denis Donadel Francesco Marchiori Luca Pajola Mauro Conti 78 7 0 19 Apr 2024
Metaphor Understanding Challenge Dataset for LLMs Xiaoyu Tong Rochelle Choenni Martha Lewis Ekaterina Shutova 58 10 0 18 Mar 2024
Previously on the Stories: Recap Snippet Identification for Story Reading JiangNan Li Qiujing Wang Liyan Xu Wenjie Pang Mo Yu Zheng Lin Weiping Wang Jie Zhou 69 3 0 11 Feb 2024
Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language Conversion for Language Models Yile Wang Sijie Cheng Zixin Sun Peng Li Yang Liu ReLM LRM 61 4 0 22 Jan 2024
InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen Jiannan Wu Wenhai Wang Weijie Su Guo Chen ... Bin Li Ping Luo Tong Lu Yu Qiao Jifeng Dai VLM MLLM 224 1,102 0 21 Dec 2023
Mistral 7B Albert Q. Jiang Alexandre Sablayrolles A. Mensch Chris Bamford Devendra Singh Chaplot ... Teven Le Scao Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LRM 61 2,170 0 10 Oct 2023
Large Language Model (LLM) as a System of Multiple Expert Agents: An Approach to solve the Abstraction and Reasoning Corpus (ARC) Challenge J. Tan Mehul Motani LLMAG 56 10 0 08 Oct 2023
Improved Baselines with Visual Instruction Tuning Haotian Liu Chunyuan Li Yuheng Li Yong Jae Lee VLM MLLM 108 2,672 0 05 Oct 2023
The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A" Lukas Berglund Meg Tong Max Kaufmann Mikita Balesni Asa Cooper Stickland Tomasz Korbak Owain Evans LRM 101 267 0 21 Sep 2023
Hypothesis Search: Inductive Reasoning with Language Models Ruocheng Wang E. Zelikman Gabriel Poesia Yewen Pu Nick Haber Noah D. Goodman ReLM LRM 85 106 0 11 Sep 2023
Large Language Models as General Pattern Machines Suvir Mirchandani F. Xia Peter R. Florence Brian Ichter Danny Driess Montse Gonzalez Arenas Kanishka Rao Dorsa Sadigh Andy Zeng LLMAG 97 194 0 10 Jul 2023
A Survey on Evaluation of Large Language Models Yu-Chu Chang Xu Wang Jindong Wang Yuanyi Wu Linyi Yang ... Yue Zhang Yi-Ju Chang Philip S. Yu Qian Yang Xingxu Xie ELM LM&MA ALM 106 1,659 0 06 Jul 2023
ANPL: Towards Natural Programming with Interactive Decomposition Di Huang Ziyuan Nan Xingui Hu Pengwei Jin Shaohui Peng ... Rui Zhang Zidong Du Qi Guo Yewen Pu Yunji Chen 50 9 0 29 May 2023
LLMs and the Abstraction and Reasoning Corpus: Successes, Failures, and the Importance of Object-based Representations Yudong Xu Wenhao Li Pashootan Vaezipoor Scott Sanner Elias Boutros Khalil LRM 44 60 0 26 May 2023
Flocks of Stochastic Parrots: Differentially Private Prompt Learning for Large Language Models Haonan Duan Adam Dziedzic Nicolas Papernot Franziska Boenisch AAML 37 64 0 24 May 2023
Language Models Meet World Models: Embodied Experiences Enhance Language Models Jiannan Xiang Tianhua Tao Yi Gu Tianmin Shu Zirui Wang Zichao Yang Zhiting Hu ALM LLMAG LM&Ro CLL 63 102 0 18 May 2023
Personality Understanding of Fictional Characters during Book Reading Mo Yu JiangNan Li Shunyu Yao Wenjie Pang Xiaochen Zhou Zhou Xiao Fandong Meng Jie Zhou 69 16 0 17 May 2023
The Dark Side of ChatGPT: Legal and Ethical Challenges from Stochastic Parrots and Hallucination Z. Li AILaw SILM 70 37 0 21 Apr 2023
Stochastic Parrots Looking for Stochastic Parrots: LLMs are Easy to Fine-Tune and Hard to Detect with other LLMs Da Silva Gameiro Henrique Andrei Kucharavy R. Guerraoui DeLMO 58 8 0 18 Apr 2023
Visual Instruction Tuning Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee SyDa VLM MLLM 435 4,715 0 17 Apr 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.2K 14,289 0 15 Mar 2023
The Debate Over Understanding in AI's Large Language Models Melanie Mitchell D. Krakauer ELM 100 216 0 14 Oct 2022
Do Androids Laugh at Electric Sheep? Humor "Understanding" Benchmarks from The New Yorker Caption Contest Jack Hessel Ana Marasović Jena D. Hwang Lillian Lee Jeff Da Rowan Zellers Robert Mankoff Yejin Choi VLM 68 89 0 13 Sep 2022
FLUTE: Figurative Language Understanding through Textual Explanations Tuhin Chakrabarty Arkadiy Saakyan Debanjan Ghosh Smaranda Muresan 66 70 0 24 May 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 742 9,330 0 28 Jan 2022
Recent Advances in Natural Language Processing via Large Pre-Trained Language Models: A Survey Bonan Min Hayley L Ross Elior Sulem Amir Pouran Ben Veyseh Thien Huu Nguyen Oscar Sainz Eneko Agirre Ilana Heinz Dan Roth LM&MA VLM AI4CE 107 1,065 0 01 Nov 2021
LoRA: Low-Rank Adaptation of Large Language Models J. E. Hu Yelong Shen Phillip Wallis Zeyuan Allen-Zhu Yuanzhi Li Shean Wang Lu Wang Weizhu Chen OffRL AI4TS AI4CE ALM AIMat 373 10,273 0 17 Jun 2021
Communicating Natural Programs to Humans and Machines Samuel Acquaviva Yewen Pu Marta Kryven Theo Sechopoulos Catherine Wong Gabrielle Ecanow Maxwell Nye Michael Henry Tessler J. Tenenbaum 48 41 0 15 Jun 2021
A Survey of Embodied AI: From Simulators to Research Tasks Jiafei Duan Samson Yu Tangyao Li Huaiyu Zhu Cheston Tan LM&Ro 61 284 0 08 Mar 2021
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 702 41,736 0 28 May 2020
Habitat: A Platform for Embodied AI Research Manolis Savva Abhishek Kadian Oleksandr Maksymets Yili Zhao Erik Wijmans ... Jia-Wei Liu V. Koltun Jitendra Malik Devi Parikh Dhruv Batra LM&Ro 99 1,401 0 02 Apr 2019
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dollár Ross B. Girshick ObjD 344 27,129 0 20 Mar 2017
Fully Convolutional Networks for Semantic Segmentation Evan Shelhamer Jonathan Long Trevor Darrell VOS SSeg 666 37,806 0 20 May 2016
Rich feature hierarchies for accurate object detection and semantic segmentation Ross B. Girshick Jeff Donahue Trevor Darrell Jitendra Malik ObjD 276 26,168 0 11 Nov 2013