v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

19 June 2019

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

50 / 3,520 papers shown

Title
FPTQ: Fine-grained Post-Training Quantization for Large Language Models Qingyuan Li Yifan Zhang Liang Li Peng Yao Bo Zhang Xiangxiang Chu Yerui Sun Li-Qiang Du Yuchen Xie MQ 110 13 0 30 Aug 2023
MerA: Merging Pretrained Adapters For Few-Shot Learning Shwai He Run-Ze Fan Liang Ding Li Shen Dinesh Manocha Dacheng Tao MoMe 73 12 0 30 Aug 2023
TransPrompt v2: A Transferable Prompting Framework for Cross-task Text Classification Jiadong Wang Chengyu Wang Cen Chen Ming Gao Jun Huang Aoying Zhou VLM 94 0 0 29 Aug 2023
Breaking the Bank with ChatGPT: Few-Shot Text Classification for Finance Lefteris Loukas Ilias Stogiannidis Prodromos Malakasiotis Stavros Vassos 81 23 0 28 Aug 2023
A Multi-Task Semantic Decomposition Framework with Task-specific Pre-training for Few-Shot NER Guanting Dong Zechen Wang Jinxu Zhao Gang Zhao Daichi Guo ... Keqing He Xuefeng Li Liwen Wang Xinyue Cui Weiran Xu 84 22 0 28 Aug 2023
AI-Generated Content (AIGC) for Various Data Modalities: A Survey Lin Geng Foo Hossein Rahmani Jing Liu 280 31 0 27 Aug 2023
LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors Chengkun Wei Wenlong Meng Zhikun Zhang M. Chen Ming-Hui Zhao Wenjing Fang Lei Wang Zihui Zhang Wenzhi Chen AAML 65 11 0 26 Aug 2023
Expressive paragraph text-to-speech synthesis with multi-step variational autoencoder Xuyuan Li Zengqiang Shang Peiyang Shi Hua Hua Jian Liu Pengyuan Zhang 92 0 0 25 Aug 2023
An Ensemble Approach to Personalized Real Time Predictive Writing for Experts Sourav Prosad Viswa Datha Polavarapu Shrutendra Harsola 47 0 0 25 Aug 2023
MatchXML: An Efficient Text-label Matching Framework for Extreme Multi-label Text Classification Hui Ye Rajshekhar Sunderraman Shihao Ji 104 3 0 25 Aug 2023
Learning Representations on Logs for AIOps Pranjal Gupta Harshit Kumar Debanjana Kar Karan Bhukar Pooja Aggarwal P. Mohapatra 54 11 0 18 Aug 2023
Lip Reading for Low-resource Languages by Learning and Combining General Speech Knowledge and Language-specific Knowledge Minsu Kim Jeong Hun Yeo J. Choi Y. Ro 79 17 0 18 Aug 2023
Characterizing Information Seeking Events in Health-Related Social Discourse Omar Sharif Madhusudan Basak Tanzia Parvin Ava Scharfstein Alphonso Bradham J. Borodovsky S. Lord S. Preum 63 7 0 17 Aug 2023
ICAR: Image-based Complementary Auto Reasoning Xijun Wang An-Chun Liang Junbang Liang Ming-Shun Lin Yukuan Lou Shan Yang 83 1 0 17 Aug 2023
Domain-Aware Fine-Tuning: Enhancing Neural Network Adaptability Seokhyeon Ha S. Jung Jungwook Lee 47 4 0 15 Aug 2023
SPM: Structured Pretraining and Matching Architectures for Relevance Modeling in Meituan Search Wen-xin Zan Yaopeng Han Xiaotian Jiang Yao Xiao Yang Yang Dayao Chen Sheng Chen 74 3 0 15 Aug 2023
Large Language Models for Information Retrieval: A Survey Yutao Zhu Huaying Yuan Shuting Wang Jiongnan Liu Wenhan Liu Chenlong Deng Haonan Chen Zhicheng Dou Ji-Rong Wen KELM 181 317 0 14 Aug 2023
Isomer: Isomerous Transformer for Zero-shot Video Object Segmentation Yichen Yuan Yifan Wang Lijun Wang Xiaoqi Zhao Huchuan Lu Yu Wang Wei Su Lei Zhang VOS 86 11 0 13 Aug 2023
ERNetCL: A novel emotion recognition network in textual conversation based on curriculum learning strategy Jiang Li Xiaoping Wang Yingjian Liu Zhigang Zeng 93 6 0 12 Aug 2023
Foundation Model is Efficient Multimodal Multitask Model Selector Fanqing Meng Wenqi Shao Zhanglin Peng Chong Jiang Kaipeng Zhang Yu Qiao Ping Luo 67 17 0 11 Aug 2023
A Bipartite Graph is All We Need for Enhancing Emotional Reasoning with Commonsense Knowledge Kailai Yang Tianlin Zhang Shaoxiong Ji Sophia Ananiadou 70 5 0 09 Aug 2023
DiVa: An Iterative Framework to Harvest More Diverse and Valid Labels from User Comments for Music Hongru Liang Jingyao Liu Yuanxin Xiang Jiachen Du Lanjun Zhou Shushen Pan Wenqiang Lei Sichuan University 125 0 0 09 Aug 2023
3D-VisTA: Pre-trained Transformer for 3D Vision and Text Alignment Ziyu Zhu Xiaojian Ma Yixin Chen Zhidong Deng Siyuan Huang Qing Li LM&Ro 85 123 0 08 Aug 2023
Unifying Two-Stream Encoders with Transformers for Cross-Modal Retrieval Yi Bin Haoxuan Li Yahui Xu Xing Xu Yang Yang Heng Tao Shen VOS 71 20 0 08 Aug 2023
Adapting Foundation Models for Information Synthesis of Wireless Communication Specifications Manikanta Kotaru 134 10 0 08 Aug 2023
Guarding the Guardians: Automated Analysis of Online Child Sexual Abuse J. Puentes Angela Castillo Wilmar Osejo Yuly Calderón Viviana Quintero L. Saldarriaga D. Agudelo Pablo Arbelaez 55 2 0 07 Aug 2023
Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence Marcel Moravek Alexander Zender Andreas Müller 17 0 0 07 Aug 2023
Analysis of the Evolution of Advanced Transformer-Based Language Models: Experiments on Opinion Mining Nour Eddine Zekaoui Siham Yousfi Maryem Rhanoui M. Mikram 49 3 0 07 Aug 2023
Spanish Pre-trained BERT Model and Evaluation Data J. Cañete Gabriel Chaperon Rodrigo Fuentes Jou-Hui Ho Hojin Kang Jorge Pérez 95 667 0 06 Aug 2023
How Good Are SOTA Fake News Detectors Matthew Iceland 58 6 0 04 Aug 2023
MAP: A Model-agnostic Pretraining Framework for Click-through Rate Prediction Jianghao Lin Yanru Qu Wei Guo Xinyi Dai Ruiming Tang Yong Yu Weinan Zhang 72 21 0 03 Aug 2023
Target-point Attention Transformer: A novel trajectory predict network for end-to-end autonomous driving Jing Du Yang Zhao Hong-wei Cheng ViT 48 1 0 03 Aug 2023
Fountain -- an intelligent contextual assistant combining knowledge representation and language models for manufacturing risk identification Saurabh Kumar D. Fuchs K. Spindler 41 1 0 01 Aug 2023
Contrastive Learning for API Aspect Analysis G. M. Shahariar Tahmid Hasan Anindya Iqbal Gias Uddin 49 0 0 31 Jul 2023
Text Analysis Using Deep Neural Networks in Digital Humanities and Information Science Omri Suissa Avshalom Elmalech M. Zhitomirsky-Geffet AI4CE 57 48 0 30 Jul 2023
MSStyleTTS: Multi-Scale Style Modeling with Hierarchical Context Information for Expressive Speech Synthesis Shunwei Lei Yixuan Zhou Liyang Chen Zhiyong Wu Xixin Wu Shiyin Kang Helen Meng 87 7 0 29 Jul 2023
ATESA-BÆRT: A Heterogeneous Ensemble Learning Model for Aspect-Based Sentiment Analysis Elena Simona Apostol Alin-Georgian Pisica Ciprian-Octavian Truică 51 3 0 29 Jul 2023
CFN-ESA: A Cross-Modal Fusion Network with Emotion-Shift Awareness for Dialogue Emotion Recognition Jiang Li Xiaoping Wang Yingjian Liu Zhigang Zeng 112 19 0 28 Jul 2023
WC-SBERT: Zero-Shot Text Classification via SBERT with Self-Training for Wikipedia Categories Te-Yu Chi Y. Tang Chia-Wen Lu Qiuyue Zhang J. Jang 74 2 0 28 Jul 2023
Retrieval-based Text Selection for Addressing Class-Imbalanced Data in Classification Sareh Ahmadi Aditya Shah Edward A. Fox 24 1 0 27 Jul 2023
DPBERT: Efficient Inference for BERT based on Dynamic Planning Weixin Wu H. Zhuo 23 0 0 26 Jul 2023
A Hybrid Machine Learning Model for Classifying Gene Mutations in Cancer using LSTM, BiLSTM, CNN, GRU, and GloVe Sanad Aburass O. Dorgham Jamil Al Shaqsi 73 28 0 24 Jul 2023
PUMA: Secure Inference of LLaMA-7B in Five Minutes Ye Dong Wen-jie Lu Yancheng Zheng Haoqi Wu Derun Zhao Jin Tan Zhicong Huang Cheng Hong Tao Wei Wen-Chang Cheng 72 61 0 24 Jul 2023
Explainable Topic-Enhanced Argument Mining from Heterogeneous Sources Jiasheng Si Yingjie Zhu Xingyu Shi Deyu Zhou Yulan He 25 0 0 22 Jul 2023
MythQA: Query-Based Large-Scale Check-Worthy Claim Detection through Multi-Answer Open-Domain Question Answering Yang Bai Anthony Colas D. Wang HILM 46 2 0 21 Jul 2023
Pluvio: Assembly Clone Search for Out-of-domain Architectures and Libraries through Transfer Learning and Conditional Variational Information Bottleneck Zhiwei Fu Steven H. H. Ding Furkan Alaca Benjamin C. M. Fung P. Charland 44 1 0 20 Jul 2023
Building Socio-culturally Inclusive Stereotype Resources with Community Engagement Sunipa Dev J. Goyal Dinesh Tewari Shachi Dave Vinodkumar Prabhakaran 69 26 0 20 Jul 2023
General Debiasing for Multimodal Sentiment Analysis Teng Sun Juntong Ni Wenjie Wang Liqiang Jing Yin-wei Wei Liqiang Nie 82 15 0 20 Jul 2023
Integrating a Heterogeneous Graph with Entity-aware Self-attention using Relative Position Labels for Reading Comprehension Model Shima Foolad Kourosh Kiani 56 1 0 19 Jul 2023
Pseudo Outlier Exposure for Out-of-Distribution Detection using Pretrained Transformers Jaeyoung Kim Kyuheon Jung Dongbin Na Sion Jang Eunbin Park Sungchul Choi OODD 69 7 0 18 Jul 2023