oLMpics -- On what Language Model Pre-training Captures

31 December 2019

Papers citing "oLMpics -- On what Language Model Pre-training Captures"

50 / 197 papers shown

Title
Unifying Structure Reasoning and Language Model Pre-training for Complex Reasoning Siyuan Wang Zhongyu Wei Jiarong Xu Taishan Li Zhihao Fan LRM 36 5 0 21 Jan 2023
Dissociating language and thought in large language models Kyle Mahowald Anna A. Ivanova I. Blank Nancy Kanwisher J. Tenenbaum Evelina Fedorenko ELM ReLM 29 209 0 16 Jan 2023
Analyzing Semantic Faithfulness of Language Models via Input Intervention on Question Answering Akshay Chaturvedi Swarnadeep Bhar Soumadeep Saha Utpal Garain Nicholas Asher 33 5 0 21 Dec 2022
Rarely a problem? Language models exhibit inverse scaling in their predictions following few-type quantifiers J. Michaelov Benjamin Bergen 17 17 0 16 Dec 2022
Evaluating Step-by-Step Reasoning through Symbolic Verification Yi-Fan Zhang Hanlin Zhang Li Erran Li Eric P. Xing ReLM LRM 19 8 0 16 Dec 2022
Event knowledge in large language models: the gap between the impossible and the unlikely Carina Kauf Anna A. Ivanova Giulia Rambelli Emmanuele Chersoni Jingyuan Selena She Zawad Chowdhury Evelina Fedorenko Alessandro Lenci 37 67 0 02 Dec 2022
Demystify Self-Attention in Vision Transformers from a Semantic Perspective: Analysis and Application Leijie Wu Song Guo Yaohong Ding Junxiao Wang Wenchao Xu Richard Yi Da Xu Jiewei Zhang 41 2 0 13 Nov 2022
A Survey of Knowledge Enhanced Pre-trained Language Models Linmei Hu Zeyi Liu Ziwang Zhao Lei Hou Liqiang Nie Juanzi Li KELM VLM 24 123 0 11 Nov 2022
COPEN: Probing Conceptual Knowledge in Pre-trained Language Models Hao Peng Xiaozhi Wang Shengding Hu Hailong Jin Lei Hou Juanzi Li Zhiyuan Liu Qun Liu 18 22 0 08 Nov 2022
LMentry: A Language Model Benchmark of Elementary Language Tasks Avia Efrat Or Honovich Omer Levy 29 19 0 03 Nov 2022
IELM: An Open Information Extraction Benchmark for Pre-Trained Language Models Chenguang Wang Xiao Liu Dawn Song VLM 24 2 0 25 Oct 2022
Do Language Models Understand Measurements? Sungjin Park Seung-kook Ryu Edward Choi ReLM LRM 42 4 0 23 Oct 2022
LMPriors: Pre-Trained Language Models as Task-Specific Priors Kristy Choi Chris Cundy Sanjari Srivastava Stefano Ermon BDL 56 37 0 22 Oct 2022
A Survey of Parameters Associated with the Quality of Benchmarks in NLP Swaroop Mishra Anjana Arunkumar Chris Bryan Chitta Baral 37 1 0 14 Oct 2022
MetaFill: Text Infilling for Meta-Path Generation on Heterogeneous Information Networks Zequn Liu Kefei Duan Junwei Yang Hanwen Xu Ming Zhang Sheng Wang MoE 30 0 0 14 Oct 2022
CHARD: Clinical Health-Aware Reasoning Across Dimensions for Text Generation Models Steven Y. Feng Vivek Khetan Bogdan Sacaleanu A. Gershman Eduard H. Hovy LRM 35 10 0 09 Oct 2022
Measuring and Narrowing the Compositionality Gap in Language Models Ofir Press Muru Zhang Sewon Min Ludwig Schmidt Noah A. Smith M. Lewis ReLM KELM LRM 52 557 0 07 Oct 2022
State-of-the-art generalisation research in NLP: A taxonomy and review Dieuwke Hupkes Mario Giulianelli Verna Dankers Mikel Artetxe Yanai Elazar ... Leila Khalatbari Maria Ryskina Rita Frieske Ryan Cotterell Zhijing Jin 121 94 0 06 Oct 2022
Recitation-Augmented Language Models Zhiqing Sun Xuezhi Wang Yi Tay Yiming Yang Denny Zhou RALM 196 60 0 04 Oct 2022
Negation, Coordination, and Quantifiers in Contextualized Language Models A. Kalouli Rita Sevastjanova C. Beck Maribel Romero 42 12 0 16 Sep 2022
CommunityLM: Probing Partisan Worldviews from Language Models Hang Jiang Doug Beeferman Brandon Roy Dwaipayan Roy 96 32 0 15 Sep 2022
VIPHY: Probing "Visible" Physical Commonsense Knowledge Shikhar Singh Ehsan Qasemi Muhao Chen 46 6 0 15 Sep 2022
Lost in Context? On the Sense-wise Variance of Contextualized Word Embeddings Yile Wang Yue Zhang 19 4 0 20 Aug 2022
UnCommonSense: Informative Negative Knowledge about Everyday Concepts Hiba Arnaout Simon Razniewski Gerhard Weikum Jeff Z. Pan 26 11 0 19 Aug 2022
Pro-tuning: Unified Prompt Tuning for Vision Tasks Xing Nie Bolin Ni Jianlong Chang Gaomeng Meng Chunlei Huo Zhaoxiang Zhang Shiming Xiang Qi Tian Chunhong Pan AAML VPVLM VLM 32 70 0 28 Jul 2022
Inner Monologue: Embodied Reasoning through Planning with Language Models Wenlong Huang F. Xia Ted Xiao Harris Chan Jacky Liang ... Tomas Jackson Linda Luu Sergey Levine Karol Hausman Brian Ichter LLMAG LM&Ro LRM 41 860 0 12 Jul 2022
An Empirical Survey on Long Document Summarization: Datasets, Models and Metrics Huan Yee Koh Jiaxin Ju Ming Liu Shirui Pan 81 122 0 03 Jul 2022
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks Venelin Kovatchev Trina Chatterjee Venkata S Govindarajan Jifan Chen Eunsol Choi ... K. Erk Matthew Lease Junyi Jessy Li Yating Wu Kyle Mahowald AAML ELM 19 10 0 29 Jun 2022
Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval Xiao Dong Xunlin Zhan Yunchao Wei Xiaoyong Wei Yaowei Wang Minlong Lu Xiaochun Cao Xiaodan Liang 24 11 0 17 Jun 2022
History Compression via Language Models in Reinforcement Learning Fabian Paischer Thomas Adler Vihang Patil Angela Bitto-Nemling Markus Holzleitner Sebastian Lehner Hamid Eghbalzadeh Sepp Hochreiter OffRL AI4TS 21 42 0 24 May 2022
GeoMLAMA: Geo-Diverse Commonsense Probing on Multilingual Pre-Trained Language Models Da Yin Hritik Bansal Masoud Monajatipoor Liunian Harold Li Kai-Wei Chang 49 28 0 24 May 2022
The Curious Case of Control Elias Stengel-Eskin Benjamin Van Durme 24 0 0 24 May 2022
Instruction Induction: From Few Examples to Natural Language Task Descriptions Or Honovich Uri Shaham Samuel R. Bowman Omer Levy ELM LRM 120 137 0 22 May 2022
Life after BERT: What do Other Muppets Understand about Language? Vladislav Lialin Kevin Zhao Namrata Shivagunde Anna Rumshisky 47 6 0 21 May 2022
ElitePLM: An Empirical Study on General Language Ability Evaluation of Pretrained Language Models Junyi Li Tianyi Tang Zheng Gong Lixin Yang Zhuohao Yu Z. Chen Jingyuan Wang Wayne Xin Zhao Ji-Rong Wen LM&MA ELM 16 7 0 03 May 2022
Entity-aware Transformers for Entity Search E. Gerritse Faegheh Hasibi A. D. Vries 28 22 0 02 May 2022
A Review on Language Models as Knowledge Bases Badr AlKhamissi Millicent Li Asli Celikyilmaz Mona T. Diab Marjan Ghazvininejad KELM 41 175 0 12 Apr 2022
Knowledge Infused Decoding Ruibo Liu Guoqing Zheng Shashank Gupta Radhika Gaonkar Chongyang Gao Soroush Vosoughi Milad Shokouhi Ahmed Hassan Awadallah KELM 25 14 0 06 Apr 2022
Can Prompt Probe Pretrained Language Models? Understanding the Invisible Risks from a Causal View Boxi Cao Hongyu Lin Xianpei Han Fangchao Liu Le Sun ELM AAML 25 41 0 23 Mar 2022
DP-KB: Data Programming with Knowledge Bases Improves Transformer Fine Tuning for Answer Sentence Selection Nic Jedema Thuy Vu Manish Gupta Alessandro Moschitti 17 1 0 17 Mar 2022
Iteratively Prompt Pre-trained Language Models for Chain of Thought Boshi Wang Xiang Deng Huan Sun KELM ReLM LRM 24 95 0 16 Mar 2022
"Is Whole Word Masking Always Better for Chinese BERT?": Probing on Chinese Grammatical Error Correction Yong Dai Linyang Li Cong Zhou Zhangyin Feng Enbo Zhao Xipeng Qiu Pijian Li Duyu Tang 25 13 0 01 Mar 2022
On the data requirements of probing Zining Zhu Jixuan Wang Bai Li Frank Rudzicz 27 5 0 25 Feb 2022
Do Transformers know symbolic rules, and would we know if they did? Tommi Gröndahl Yu-Wen Guo Nirmal Asokan 25 0 0 19 Feb 2022
Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents Wenlong Huang Pieter Abbeel Deepak Pathak Igor Mordatch LM&Ro 42 1,062 0 18 Jan 2022
Kformer: Knowledge Injection in Transformer Feed-Forward Layers Yunzhi Yao Shaohan Huang Li Dong Furu Wei Huajun Chen Ningyu Zhang KELM MedIm 29 42 0 15 Jan 2022
CommonsenseQA 2.0: Exposing the Limits of AI through Gamification Alon Talmor Ori Yoran Ronan Le Bras Chandrasekhar Bhagavatula Yoav Goldberg Yejin Choi Jonathan Berant ELM 21 141 0 14 Jan 2022
Zero-shot Commonsense Question Answering with Cloze Translation and Consistency Optimization Zi-Yi Dou Nanyun Peng ELM 15 26 0 01 Jan 2022
Pushing the Limits of Rule Reasoning in Transformers through Natural Language Satisfiability Kyle Richardson Ashish Sabharwal ReLM LRM 30 24 0 16 Dec 2021
Does Pre-training Induce Systematic Inference? How Masked Language Models Acquire Commonsense Knowledge Ian Porada Alessandro Sordoni Jackie C.K. Cheung 29 5 0 16 Dec 2021