v1v2 (latest)

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

11 October 2018

Papers citing "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

50 / 23,639 papers shown

Title
DOBF: A Deobfuscation Pre-Training Objective for Programming Languages Baptiste Roziere Marie-Anne Lachaux Marc Szafraniec Guillaume Lample AI4CE 156 141 0 15 Feb 2021
Beyond the English Web: Zero-Shot Cross-Lingual and Lightweight Monolingual Classification of Registers Liina Repo Valtteri Skantsi Samuel Rönnqvist Saara Hellström Miika Oinonen Anna Salmela D. Biber Jesse Egbert S. Pyysalo Veronika Laippala 45 20 0 15 Feb 2021
Leveraging Acoustic and Linguistic Embeddings from Pretrained speech and language Models for Intent Classification Bidisha Sharma Maulik C. Madhavi Haizhou Li 51 20 0 15 Feb 2021
Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm Laria Reynolds Kyle McDonell 137 932 0 15 Feb 2021
MATCH: Metadata-Aware Text Classification in A Large Hierarchy Yu Zhang Zhihong Shen Yuxiao Dong Kuansan Wang Jiawei Han 70 36 0 15 Feb 2021
Knowledge Graph Embedding using Graph Convolutional Networks with Relation-Aware Attention Nasrullah Sheikh Xiao Qin B. Reinwald Christoph Miksovic Thomas Gschwind P. Scotton GNN 63 10 0 14 Feb 2021
Improved Bengali Image Captioning via deep convolutional neural network based encoder-decoder model Mohammad Faiyaz Khan S. M. S. Shifath Md. Saiful Islam VLM 65 21 0 14 Feb 2021
indicnlp@kgp at DravidianLangTech-EACL2021: Offensive Language Identification in Dravidian Languages Kushal Kedia Abhilash Nandy 59 23 0 14 Feb 2021
CATE: Computation-aware Neural Architecture Encoding with Transformers Shen Yan Kaiqiang Song Z. Feng Mi Zhang 83 28 0 14 Feb 2021
TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up Yi Ding Shiyu Chang Zhangyang Wang ViT 168 394 0 14 Feb 2021
PAQ: 65 Million Probably-Asked Questions and What You Can Do With Them Patrick Lewis Yuxiang Wu Linqing Liu Pasquale Minervini Heinrich Küttler Aleksandra Piktus Pontus Stenetorp Sebastian Riedel RALM 151 234 0 13 Feb 2021
The first large scale collection of diverse Hausa language datasets Isa Inuwa-Dutse 74 15 0 13 Feb 2021
On Technical Trading and Social Media Indicators in Cryptocurrencies' Price Classification Through Deep Learning Marco Ortu Nicola Uras C. Conversano Giuseppe Destefanis Silvia Bartolucci 97 28 0 13 Feb 2021
Understanding Negative Samples in Instance Discriminative Self-supervised Representation Learning Kento Nozawa Issei Sato SSL 136 46 0 13 Feb 2021
Domain Adaptation for Time Series Forecasting via Attention Sharing Xiaoyong Jin Youngsuk Park Danielle C. Maddix Bernie Wang Xifeng Yan TTA OOD AI4TS 186 78 0 13 Feb 2021
Characterizing English Variation across Social Media Communities with BERT L. Lucy David Bamman 67 35 0 12 Feb 2021
Neural Network Libraries: A Deep Learning Framework Designed from Engineers' Perspectives T. Narihira Javier Alonsogarcia Fabien Cardinaux Akio Hayakawa Masato Ishii ... Kenji Suzuki Stephen Tiedmann Stefan Uhlich T. Yashima K. Yoshiyama 61 11 0 12 Feb 2021
Optimizing Inference Performance of Transformers on CPUs D. Dice Alex Kogan 64 16 0 12 Feb 2021
Large-Scale Representation Learning on Graphs via Bootstrapping S. Thakoor Corentin Tallec M. G. Azar Mehdi Azabou Eva L. Dyer Rémi Munos Petar Velivcković Michal Valko SSL 85 228 0 12 Feb 2021
Transformer Language Models with LSTM-based Cross-utterance Information Representation G. Sun Chuxu Zhang P. Woodland 114 32 0 12 Feb 2021
Bootstrapping Large-Scale Fine-Grained Contextual Advertising Classifier from Wikipedia Yi-Fei Jin Vishakha Kadam Dittaya Wanvarie 28 4 0 12 Feb 2021
Emoji-Based Transfer Learning for Sentiment Tasks Susann Boy Dana Ruiter Dietrich Klakow 42 2 0 12 Feb 2021
Neural Inverse Text Normalization Monica Sunkara Chaitanya P. Shivade S. Bodapati Katrin Kirchhoff 95 32 0 12 Feb 2021
Dynamic Precision Analog Computing for Neural Networks Sahaj Garg Joe Lou Anirudh Jain Mitchell Nahmias 75 33 0 12 Feb 2021
Contrastive Unsupervised Learning for Speech Emotion Recognition Mao Li Bo Yang Joshua Levy A. Stolcke Viktor Rozgic Spyros Matsoukas C. Papayiannis Daniel Bone Chao Wang SSL 103 49 0 12 Feb 2021
A Large Batch Optimizer Reality Check: Traditional, Generic Optimizers Suffice Across Batch Sizes Zachary Nado Justin M. Gilmer Christopher J. Shallue Rohan Anil George E. Dahl ODL 106 27 0 12 Feb 2021
Proof Artifact Co-training for Theorem Proving with Language Models Jesse Michael Han Jason M. Rute Yuhuai Wu Edward W. Ayers Stanislas Polu AIMat 121 127 0 11 Feb 2021
Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling Jie Lei Linjie Li Luowei Zhou Zhe Gan Tamara L. Berg Joey Tianyi Zhou Jingjing Liu CLIP 203 666 0 11 Feb 2021
Testing Framework for Black-box AI Models Aniya Aggarwal Samiullah Shaikh Sandeep Hans Swastik Haldar Rema Ananthanarayanan Diptikalyan Saha 49 8 0 11 Feb 2021
Personalized Embedding-based e-Commerce Recommendations at eBay Tiantian Wang Y. Brovman S. Madhvanath 61 24 0 11 Feb 2021
SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data Chi Ian Tang I. Perez-Pozuelo Dimitris Spathis S. Brage N. Wareham Cecilia Mascolo SSL HAI VLM 82 96 0 11 Feb 2021
Cross-Domain Multi-Task Learning for Sequential Sentence Classification in Research Papers Arthur Brack Anett Hoppe Pascal Buschermöhle Ralph Ewerth 111 18 0 11 Feb 2021
Text Compression-aided Transformer Encoding Z. Li Zhuosheng Zhang Hai Zhao Rui Wang Kehai Chen Masao Utiyama Eiichiro Sumita AI4CE 71 45 0 11 Feb 2021
Toward Improving Coherence and Diversity of Slogan Generation Yiping Jin Akshay Bhatia Dittaya Wanvarie Phu T. V. Le 45 5 0 11 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 571 3,917 0 11 Feb 2021
Representation Matters: Offline Pretraining for Sequential Decision Making Mengjiao Yang Ofir Nachum SSL OffRL 107 119 0 11 Feb 2021
Fused Acoustic and Text Encoding for Multimodal Bilingual Pretraining and Speech Translation Renjie Zheng Junkun Chen Mingbo Ma Liang Huang 157 69 0 10 Feb 2021
Customizing Contextualized Language Models forLegal Document Reviews Shohreh Shaghaghian Luna Feng Feng Borna Jafarpour Nicolai Pogrebnyakov AILaw 108 19 0 10 Feb 2021
Training Vision Transformers for Image Retrieval Alaaeldin El-Nouby Natalia Neverova Ivan Laptev Hervé Jégou ViT 143 159 0 10 Feb 2021
On the Regularity of Attention James Vuckovic A. Baratin Rémi Tachet des Combes 60 7 0 10 Feb 2021
Learning Skill Equivalencies Across Platform Taxonomies Zhi Li Cheng Ren Xianyou Li Z. Pardos 46 6 0 10 Feb 2021
Privacy-Preserving Graph Convolutional Networks for Text Classification Timour Igamberdiev Ivan Habernal GNN 85 33 0 10 Feb 2021
Towards More Fine-grained and Reliable NLP Performance Prediction Zihuiwen Ye Pengfei Liu Jinlan Fu Graham Neubig 91 33 0 10 Feb 2021
Multi-turn Dialogue Reading Comprehension with Pivot Turns and Knowledge Zhuosheng Zhang Junlong Li Hai Zhao 81 24 0 10 Feb 2021
Language Models for Lexical Inference in Context Martin Schmitt Hinrich Schütze 81 14 0 10 Feb 2021
Biomedical Question Answering: A Survey of Approaches and Challenges Qiao Jin Zheng Yuan Guangzhi Xiong Qian Yu Huaiyuan Ying Chuanqi Tan Mosha Chen Songfang Huang Xiaozhong Liu Sheng Yu 108 104 0 10 Feb 2021
SensPick: Sense Picking for Word Sense Disambiguation S. Zobaed Md. Enamul Haque Md Fazle Rabby M. Salehi 46 6 0 10 Feb 2021
Decontextualization: Making Sentences Stand-Alone Eunsol Choi J. Palomaki Matthew Lamm Tom Kwiatkowski Dipanjan Das Michael Collins 70 100 0 09 Feb 2021
On Explainability of Graph Neural Networks via Subgraph Explorations Hao Yuan Haiyang Yu Jie Wang Kang Li Shuiwang Ji FAtt 83 396 0 09 Feb 2021
AuGPT: Auxiliary Tasks and Data Augmentation for End-To-End Dialogue with Pre-Trained Language Models Jonávs Kulhánek Vojtvech Hudevcek Tomávs Nekvinda Ondrej Dusek 73 46 0 09 Feb 2021