v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

19 June 2019

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

50 / 3,524 papers shown

Title
Knowledge-Grounded Dialogue Generation with a Unified Knowledge Representation Yu Li Baolin Peng Yelong Shen Yi Mao Lars Liden Zhou Yu Jianfeng Gao 89 55 0 15 Dec 2021
Classifying Emails into Human vs Machine Category Changsung Kang Hongwei Shang Jean-Marc Langlois 23 3 0 14 Dec 2021
On the Use of External Data for Spoken Named Entity Recognition Ankita Pasad Felix Wu Suwon Shon Karen Livescu Kyu Jeong Han 95 16 0 14 Dec 2021
LMTurk: Few-Shot Learners as Crowdsourcing Workers in a Language-Model-as-a-Service Framework Mengjie Zhao Fei Mi Yasheng Wang Minglei Li Xin Jiang Qun Liu Hinrich Schütze RALM 115 11 0 14 Dec 2021
Adversarial Examples for Extreme Multilabel Text Classification Mohammadreza Qaraei Rohit Babbar 65 6 0 14 Dec 2021
ACE-BERT: Adversarial Cross-modal Enhanced BERT for E-commerce Retrieval Boxuan Zhang Chao Wei Yang Jin Weiru Zhang 55 2 0 14 Dec 2021
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts Nan Du Yanping Huang Andrew M. Dai Simon Tong Dmitry Lepikhin ... Kun Zhang Quoc V. Le Yonghui Wu Zhiwen Chen Claire Cui ALM MoE 327 835 0 13 Dec 2021
Roof-Transformer: Divided and Joined Understanding with Knowledge Enhancement Wei-Lin Liao Chengwei Su Wei-Yun Ma 67 0 0 13 Dec 2021
WECHSEL: Effective initialization of subword embeddings for cross-lingual transfer of monolingual language models Benjamin Minixhofer Fabian Paischer Navid Rekabsaz 109 85 0 13 Dec 2021
Native Chinese Reader: A Dataset Towards Native-Level Chinese Machine Reading Comprehension Shusheng Xu Yichen Liu Xiaoyuan Yi Siyuan Zhou Huizi Li Yi Wu ELM 68 3 0 13 Dec 2021
Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry Karl Lowenmark C. Taal S. Schnabel Marcus Liwicki Fredrik Sandin 52 7 0 11 Dec 2021
Improving the Question Answering Quality using Answer Candidate Filtering based on Natural-Language Features Aleksandr Gashkov A. Perevalov M. Eltsova A. Both 42 3 0 10 Dec 2021
Unsupervised Editing for Counterfactual Stories Jiangjie Chen Chun Gan Sijie Cheng Hao Zhou Yanghua Xiao Lei Li 148 12 0 10 Dec 2021
AtteSTNet -- An attention and subword tokenization based approach for code-switched text hate speech detection Geet Shingi Vedangi Wagh 163 0 0 10 Dec 2021
3D Medical Point Transformer: Introducing Convolution to Attention Networks for Medical Point Cloud Analysis Jianhui Yu Chaoyi Zhang Heng Wang Dingxin Zhang Yang Song Tiange Xiang Dongnan Liu Weidong (Tom) Cai ViT MedIm 83 32 0 09 Dec 2021
Detecting potentially harmful and protective suicide-related content on twitter: A machine learning approach Hannah Metzler Hubert Baginski Thomas Niederkrotenthaler David Garcia AI4MH 59 14 0 09 Dec 2021
Ethical and social risks of harm from Language Models Laura Weidinger John F. J. Mellor Maribeth Rauh Conor Griffin J. Uesato ... Lisa Anne Hendricks William S. Isaac Sean Legassick G. Irving Iason Gabriel PILM 237 1,046 0 08 Dec 2021
JABER and SABER: Junior and Senior Arabic BERt Abbas Ghaddar Yimeng Wu Ahmad Rashid Khalil Bibi Mehdi Rezagholizadeh ... Zhefeng Wang Baoxing Huai Xin Jiang Qun Liu Philippe Langlais 64 5 0 08 Dec 2021
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang Jiaqi Wang Yansong Tang Kai-xiang Chen Hengshuang Zhao Philip Torr 228 333 0 04 Dec 2021
Survey on English Entity Linking on Wikidata Cedric Moller Jens Lehmann Ricardo Usbeck KELM 73 22 0 03 Dec 2021
Evaluating NLP Systems On a Novel Cloze Task: Judging the Plausibility of Possible Fillers in Instructional Texts Zizhao Hu Ravikiran Chanumolu Xingyu Lin Nayela Ayaz Vincent Chi ELM 24 4 0 03 Dec 2021
Single-Shot Black-Box Adversarial Attacks Against Malware Detectors: A Causal Language Model Approach Junjie Hu Mohammadreza Ebrahimi Hsinchun Chen AAML 61 11 0 03 Dec 2021
Multi-modal application: Image Memes Generation Zhiyuan Liu Chuanzheng Sun Yuxin Jiang Shiqi Jiang Mei Ming DiffM 371 2 0 03 Dec 2021
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding Dave Zhenyu Chen Qirui Wu Matthias Nießner Angel X. Chang 83 32 0 02 Dec 2021
DKPLM: Decomposable Knowledge-enhanced Pre-trained Language Model for Natural Language Understanding Taolin Zhang Chengyu Wang Nan Hu Minghui Qiu Chengguang Tang Xiaofeng He Jun Huang KELM VLM 73 30 0 02 Dec 2021
NER-BERT: A Pre-trained Model for Low-Resource Entity Tagging Zihan Liu Feijun Jiang Yuxiang Hu Chen Shi Pascale Fung 126 38 0 01 Dec 2021
Object-Aware Cropping for Self-Supervised Learning Shlok Kumar Mishra Anshul B. Shah Ankan Bansal Abhyuday N. Jagannatha Janit Anjaria Abhishek Sharma David Jacobs Dilip Krishnan SSL 108 24 0 01 Dec 2021
A Comparative Study of Transformers on Word Sense Disambiguation Avi Chawla Nidhi Mulay Vikas Bishnoi Gaurav Dhama Dr. Anil Kumar Singh 58 4 0 30 Nov 2021
EdiBERT, a generative model for image editing Thibaut Issenhuth Ugo Tanielian Jérémie Mary David Picard DiffM 104 12 0 30 Nov 2021
End-to-End Referring Video Object Segmentation with Multimodal Transformers Adam Botach Evgenii Zheltonozhskii Chaim Baskin VOS 115 150 0 29 Nov 2021
Action based Network for Conversation Question Reformulation Zheyu Ye Jiang Liu Qian Yu Jianxun Ju 63 0 0 29 Nov 2021
Long-range and hierarchical language predictions in brains and algorithms Charlotte Caucheteux Alexandre Gramfort J. King 52 22 0 28 Nov 2021
An Empirical Study of Topic Transition in Dialogue Mayank Soni Brendan Spillane E. Gilmartin Christian Saam Benjamin R. Cowan Vincent P. Wade 61 4 0 28 Nov 2021
Common Sense Knowledge Learning for Open Vocabulary Neural Reasoning: A First View into Chronic Disease Literature Ignacio Arroyo-Fernández José Armando Sánchez-Rojas Arturo Tellez-Velázquez Flavio Juárez-Martínez Raúl Cruz-Barbosa Enrique Guzmán-Ramírez Yalbi Itzel Balderas-Martínez LRM 25 0 0 27 Nov 2021
Answer Generation for Questions With Multiple Information Sources in E-Commerce Anand A. Rajasekar Nikesh Garera RALM 46 2 0 27 Nov 2021
Simple Contrastive Representation Adversarial Learning for NLP Tasks Deshui Miao Jiaqi Zhang Wenbo Xie Jian Song Xin Li Lijuan Jia Ning Guo SSL 43 13 0 26 Nov 2021
VIOLET : End-to-End Video-Language Transformers with Masked Visual-token Modeling Tsu-Jui Fu Linjie Li Zhe Gan Kevin Qinghong Lin Wenjie Wang Lijuan Wang Zicheng Liu VLM 157 221 0 24 Nov 2021
DBIA: Data-free Backdoor Injection Attack against Transformer Networks Peizhuo Lv Hualong Ma Jiachen Zhou Ruigang Liang Kai Chen Shengzhi Zhang Yunfei Yang 123 16 0 22 Nov 2021
Can depth-adaptive BERT perform better on binary classification tasks Jing Fan Xin Zhang Sheng Zhang Yan Pan Lixiang Guo MQ 54 0 0 22 Nov 2021
Denoised Internal Models: a Brain-Inspired Autoencoder against Adversarial Attacks Kaiyuan Liu Xingyu Li Yu-Rui Lai Hong Xie Hang Su Jiacheng Wang Chunxu Guo J. Guan Yi Zhou AAML 89 4 0 21 Nov 2021
Efficient Softmax Approximation for Deep Neural Networks with Attention Mechanism Ihor Vasyltsov Wooseok Chang 72 12 0 21 Nov 2021
Capitalization and Punctuation Restoration: a Survey V. Pais D. Tufis 80 19 0 21 Nov 2021
Lexicon-based Methods vs. BERT for Text Sentiment Analysis A. Kotelnikova D. Paschenko Klavdiya Olegovna Bochenina Evgeny Kotelnikov 53 18 0 19 Nov 2021
You Only Sample (Almost) Once: Linear Cost Self-Attention Via Bernoulli Sampling Zhanpeng Zeng Yunyang Xiong Sathya Ravi Shailesh Acharya G. Fung Vikas Singh 75 19 0 18 Nov 2021
Seeking Common but Distinguishing Difference, A Joint Aspect-based Sentiment Analysis Model Hongjiang Jing Zuchao Li Hai Zhao Shu Jiang 80 26 0 18 Nov 2021
LAnoBERT: System Log Anomaly Detection based on BERT Masked Language Model Yukyung Lee Jina Kim Pilsung Kang 64 84 0 18 Nov 2021
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing Pengcheng He Jianfeng Gao Weizhu Chen 257 1,215 0 18 Nov 2021
INTERN: A New Learning Paradigm Towards General Vision Jing Shao Siyu Chen Yangguang Li Kun Wang Zhen-fei Yin ... F. Yu Junjie Yan Dahua Lin Xiaogang Wang Yu Qiao 110 34 0 16 Nov 2021
WikiContradiction: Detecting Self-Contradiction Articles on Wikipedia Cheng-Mao Hsu Cheng-Te Li Diego Sáez-Trumper Yi-Zhan Hsu SSL 112 15 0 16 Nov 2021
Testing the Generalization of Neural Language Models for COVID-19 Misinformation Detection Jan Philip Wahle Nischal Ashok Kumar Terry Ruas Norman Meuschke Tirthankar Ghosal Bela Gipp 82 19 0 15 Nov 2021