v1v2v3v4 (latest)

The Goldilocks Principle: Reading Children's Books with Explicit Memory Representations

7 November 2015

Jason Weston

Papers citing "The Goldilocks Principle: Reading Children's Books with Explicit Memory Representations"

50 / 306 papers shown

Title
Attention-Only Transformers via Unrolled Subspace Denoising Peng Wang Yifu Lu Yaodong Yu Druv Pai Qing Qu Yi Ma ViT 124 1 0 04 Jun 2025
Findings of the BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora Alex Warstadt Aaron Mueller Leshem Choshen E. Wilcox Chengxu Zhuang ... Rafael Mosquera Bhargavi Paranjape Adina Williams Tal Linzen Ryan Cotterell 202 121 0 10 Apr 2025
Do Construction Distributions Shape Formal Language Learning In German BabyLMs? Bastian Bunzeck Daniel Duran Sina Zarrieß 123 0 0 14 Mar 2025
Building a Rich Dataset to Empower the Persian Question Answering Systems Mohsen Yazdinejad Marjan Kaedi 69 0 0 31 Dec 2024
BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models Patrick Haller Jonas Golde Alan Akbik 127 0 0 20 Dec 2024
Findings of the Second BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora Michael Y. Hu Aaron Mueller Candace Ross Adina Williams Tal Linzen Chengxu Zhuang Ryan Cotterell Leshem Choshen Alex Warstadt Ethan Gotlieb Wilcox 180 14 0 06 Dec 2024
AntLM: Bridging Causal and Masked Language Models Xinru Yu Bin Guo Shiwei Luo Jiadong Wang Tao Ji Yuanbin Wu CLL 135 1 0 04 Dec 2024
DRS: Deep Question Reformulation With Structured Output Zhecheng Li Yijiao Wang Bryan Hooi Yujun Cai Nanyun Peng Kai-Wei Chang KELM 209 0 0 27 Nov 2024
When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets? Srikrishna Iyer FedML 172 0 0 25 Nov 2024
Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System Weize Chen Jiarui Yuan Chen Qian Cheng Yang Zhiyuan Liu Maosong Sun LLMAG 91 6 0 10 Oct 2024
What Makes a Good Story and How Can We Measure It? A Comprehensive Survey of Story Evaluation Dingyi Yang Qin Jin 130 7 0 26 Aug 2024
Recent Advances in Multi-Choice Machine Reading Comprehension: A Survey on Methods and Datasets Shima Foolad Kourosh Kiani R. Rastgoo FaML 89 0 0 04 Aug 2024
Gradient-based inference of abstract task representations for generalization in neural networks Ali Hummos Felipe del-Rio Brabeeba Mien Wang Julio Hurtado Cristian B. Calderon G. Yang 71 4 0 24 Jul 2024
MoEUT: Mixture-of-Experts Universal Transformers Róbert Csordás Kazuki Irie Jürgen Schmidhuber Christopher Potts Christopher D. Manning MoE 88 11 0 25 May 2024
Transfer Learning Enhanced Single-choice Decision for Multi-choice Question Answering Chenhao Cui Yufan Jiang Shuangzhi Wu Zhoujun Li FaML 60 0 0 27 Apr 2024
Language Models Learn Rare Phenomena from Less Rare Phenomena: The Case of the Missing AANNs Kanishka Misra Kyle Mahowald 122 27 0 28 Mar 2024
SyllabusQA: A Course Logistics Question Answering Dataset Nigel Fernandez Alexander Scarlatos Andrew Lan 44 6 0 03 Mar 2024
An Integrated Data Processing Framework for Pretraining Foundation Models Yiding Sun Feng Wang Yutao Zhu Wayne Xin Zhao Jiaxin Mao 144 5 0 26 Feb 2024
Leveraging Large Language Models for Concept Graph Recovery and Question Answering in NLP Education Rui Yang Boming Yang Sixun Ouyang Tianwei She Aosong Feng Yuang Jiang Freddy Lecue Jinghui Lu Irene Li AI4Ed 76 5 0 22 Feb 2024
Triple-Encoders: Representations That Fire Together, Wire Together Justus-Jonas Erker Florian Mai Nils Reimers Gerasimos Spanakis Iryna Gurevych 85 2 0 19 Feb 2024
Distractor Generation for Multiple-Choice Questions: A Survey of Methods, Datasets, and Evaluation Elaf Alhazmi Quan Z. Sheng W. Zhang Munazza Zaib A. Alhazmi AI4Ed 85 9 0 02 Feb 2024
DsDm: Model-Aware Dataset Selection with Datamodels Logan Engstrom Axel Feldmann Aleksander Madry OODD 110 61 0 23 Jan 2024
Fine-tuning Strategies for Domain Specific Question Answering under Low Annotation Budget Constraints Kunpeng Guo Dennis Diefenbach Antoine Gourru Christophe Gravier 114 1 0 17 Jan 2024
Building Efficient and Effective OpenQA Systems for Low-Resource Languages Emrah Budur Riza Ozccelik Dilara Soylu Omar Khattab Tunga Güngör Christopher Potts 69 3 0 07 Jan 2024
SwitchHead: Accelerating Transformers with Mixture-of-Experts Attention Róbert Csordás Piotr Piekos Kazuki Irie Jürgen Schmidhuber MoE 55 17 0 13 Dec 2023
Making Translators Privacy-aware on the User's Side Ryoma Sato 45 2 0 07 Dec 2023
Not all layers are equally as important: Every Layer Counts BERT Lucas Georges Gabriel Charpentier David Samuel 103 18 0 03 Nov 2023
Don't Make Your LLM an Evaluation Benchmark Cheater Kun Zhou Yutao Zhu Zhipeng Chen Wentong Chen Wayne Xin Zhao Xu Chen Yankai Lin Ji-Rong Wen Jiawei Han ELM 186 156 0 03 Nov 2023
Mean BERTs make erratic language teachers: the effectiveness of latent bootstrapping in low-resource settings David Samuel 54 4 0 30 Oct 2023
Are NLP Models Good at Tracing Thoughts: An Overview of Narrative Understanding Lixing Zhu Runcong Zhao Lin Gui Yulan He 80 5 0 28 Oct 2023
BabyStories: Can Reinforcement Learning Teach Baby Language Models to Write Better Stories? Xingmeng Zhao Tongnian Wang Sheri Osborn Anthony Rios 53 6 0 25 Oct 2023
A Survey on LLM-Generated Text Detection: Necessity, Methods, and Future Directions Junchao Wu Shu Yang Runzhe Zhan Yulin Yuan Derek F. Wong Lidia S. Chao DeLMO 103 33 0 23 Oct 2023
ChapGTP, ILLC's Attempt at Raising a BabyLM: Improving Data Efficiency by Automatic Task Formation Jaap Jumelet Michael Hanna Marianne de Heer Kloots Anna Langedijk Charlotte Pouw Oskar van der Wal 82 3 0 17 Oct 2023
Envisioning Narrative Intelligence: A Creative Visual Storytelling Anthology Brett A. Halperin S. Lukin CoGe 92 25 0 06 Oct 2023
A Data Source for Reasoning Embodied Agents Jack Lanchantin Sainbayar Sukhbaatar Gabriel Synnaeve Yuxuan Sun Kavya Srinet Arthur Szlam LM&Ro LRM 57 5 0 14 Sep 2023
Prompt2Model: Generating Deployable Models from Natural Language Instructions Vijay Viswanathan Chenyang Zhao Amanda Bertsch Tongshuang Wu Graham Neubig 83 40 0 23 Aug 2023
Teach model to answer questions after comprehending the document Ruiqing Sun Ping Jian FaML 67 0 0 18 Jul 2023
Honey, I Shrunk the Language: Language Model Behavior at Reduced Scale Vijeta Deshpande Dan Pechi Shree Thatte Vladislav Lialin Anna Rumshisky 121 8 0 26 May 2023
Can Large Language Models Capture Dissenting Human Voices? Noah Lee Na Min An James Thorne ALM 104 32 0 23 May 2023
Empower Large Language Model to Perform Better on Industrial Domain-Specific Question Answering Fangkai Yang Pu Zhao Zezhong Wang Lu Wang Jue Zhang Mohit Garg Qingwei Lin Saravan Rajmohan Dongmei Zhang 106 51 0 19 May 2023
Entity Tracking in Language Models Najoung Kim Sebastian Schuster 147 22 0 03 May 2023
Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4 Kent K. Chang Mackenzie Cramer Sandeep Soni David Bamman RALM 249 124 0 28 Apr 2023
Is BERT Blind? Exploring the Effect of Vision-and-Language Pretraining on Visual Language Understanding Morris Alper Michael Fiman Hadar Averbuch-Elor VLM LRM 80 15 0 21 Mar 2023
Complex QA and language models hybrid architectures, Survey Xavier Daull P. Bellot Emmanuel Bruno Vincent Martin Elisabeth Murisasco ELM 212 16 0 17 Feb 2023
Call for Papers -- The BabyLM Challenge: Sample-efficient pretraining on a developmentally plausible corpus Alex Warstadt Leshem Choshen Aaron Mueller Adina Williams Ethan Gotlieb Wilcox Chengxu Zhuang 115 57 0 27 Jan 2023
RWEN-TTS: Relation-aware Word Encoding Network for Natural Text-to-Speech Synthesis Shinhyeok Oh HyeongRae Noh Yoonseok Hong Insoo Oh 75 0 0 15 Dec 2022
Open-world Story Generation with Structured Knowledge Enhancement: A Comprehensive Survey Yuxin Wang Jieru Lin Zhiwei Yu Wei Hu Börje F. Karlsson 134 20 0 09 Dec 2022
NarraSum: A Large-Scale Dataset for Abstractive Narrative Summarization Chao Zhao Faeze Brahman Kaiqiang Song Wenlin Yao Dian Yu Snigdha Chaturvedi HILM 92 8 0 02 Dec 2022
Quadapter: Adapter for GPT-2 Quantization Minseop Park J. You Markus Nagel Simyung Chang MQ 64 9 0 30 Nov 2022
InDEX: Indonesian Idiom and Expression Dataset for Cloze Test Xinying Qiu Guofeng Shi 61 0 0 24 Nov 2022