Human Parity on CommonsenseQA: Augmenting Self-Attention with External
Attention

Human Parity on CommonsenseQA: Augmenting Self-Attention with External Attention

6 December 2021

Xiaodong Liu

Papers citing "Human Parity on CommonsenseQA: Augmenting Self-Attention with External Attention"

19 / 19 papers shown

Title
SpiritSight Agent: Advanced GUI Agent with One Look Zhiyuan Huang Ziming Cheng Junting Pan Zhaohui Hou Mingjie Zhan LLMAG 99 2 0 05 Mar 2025
CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models Jonathan Bourne 54 4 0 30 Aug 2024
Collaborative Knowledge Infusion for Low-resource Stance Detection Ming Yan Joey Tianyi Zhou Ivor W. Tsang 27 3 0 28 Mar 2024
A Conversational Brain-Artificial Intelligence Interface Anja Meunier Michal Robert Zák Lucas Munz Sofiya Garkot Manuel Eder Jiachen Xu Moritz Grosse-Wentrup 33 0 0 22 Feb 2024
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions Tim Hartill N. Tan Michael Witbrock Patricia J. Riddle ReLM KELM LRM 27 2 0 02 Aug 2023
Thrust: Adaptively Propels Large Language Models with External Knowledge Xinran Zhao Hongming Zhang Xiaoman Pan Wenlin Yao Dong Yu Jianshu Chen KELM 48 4 0 19 Jul 2023
PaLM 2 Technical Report Rohan Anil Andrew M. Dai Orhan Firat Melvin Johnson Dmitry Lepikhin ... Ce Zheng Wei Zhou Denny Zhou Slav Petrov Yonghui Wu ReLM LRM 71 1,142 0 17 May 2023
Distinguish Before Answer: Generating Contrastive Explanation as Knowledge for Commonsense Question Answering Qianglong Chen Guohai Xu Mingshi Yan Ji Zhang Fei Huang Luo Si Yin Zhang 16 9 0 14 May 2023
A Survey of Knowledge Enhanced Pre-trained Language Models Linmei Hu Zeyi Liu Ziwang Zhao Lei Hou Liqiang Nie Juanzi Li KELM VLM 17 121 0 11 Nov 2022
Deep Bidirectional Language-Knowledge Graph Pretraining Michihiro Yasunaga Antoine Bosselut Hongyu Ren Xikun Zhang Christopher D. Manning Percy Liang J. Leskovec 20 193 0 17 Oct 2022
Explanations from Large Language Models Make Small Reasoners Better Shiyang Li Jianshu Chen Yelong Shen Zhiyu Zoey Chen Xinlu Zhang ... Jingu Qian Baolin Peng Yi Mao Wenhu Chen Xifeng Yan ReLM LRM 33 129 0 13 Oct 2022
Impossible Triangle: What's Next for Pre-trained Language Models? Chenguang Zhu Michael Zeng 16 1 0 13 Apr 2022
Leveraging Knowledge in Multilingual Commonsense Reasoning Yuwei Fang Shuohang Wang Yichong Xu Ruochen Xu Siqi Sun Chenguang Zhu Michael Zeng LRM 234 17 0 16 Oct 2021
Carbon Emissions and Large Neural Network Training David A. Patterson Joseph E. Gonzalez Quoc V. Le Chen Liang Lluís-Miquel Munguía D. Rothchild David R. So Maud Texier J. Dean AI4CE 241 643 0 21 Apr 2021
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge Bill Yuchen Lin Ziyi Wu Yichi Yang Dong-Ho Lee Xiang Ren ReLM LRM 236 64 0 02 Jan 2021
Learning Contextualized Knowledge Structures for Commonsense Reasoning Jun Yan Mrigank Raman Aaron Chan Tianyu Zhang Ryan Rossi Handong Zhao Sungchul Kim Nedim Lipka Xiang Ren 231 36 0 24 Oct 2020
Posterior Differential Regularization with f-divergence for Improving Model Robustness Hao Cheng Xiaodong Liu L. Pereira Yaoliang Yu Jianfeng Gao 240 31 0 23 Oct 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 228 4,460 0 23 Jan 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 297 6,950 0 20 Apr 2018