v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

19 June 2019

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

50 / 3,518 papers shown

Title
Negation Triplet Extraction with Syntactic Dependency and Semantic Consistency Yuchen Shi Deqing Yang Jingping Liu Yanghua Xiao Zongyu Wang Huimin Xu 67 0 0 15 Apr 2024
σ-GPTs: A New Approach to Autoregressive Models Arnaud Pannatier Evann Courdier Franccois Fleuret AI4TS 97 10 0 15 Apr 2024
The 8th AI City Challenge Shuo Wang D. Anastasiu Zhenghang Tang Ming-Ching Chang Yue Yao ... Xunlei Wu S. Pusegaonkar Yizhou Wang Sujit Biswas Rama Chellappa 117 32 0 15 Apr 2024
Neuro-Inspired Information-Theoretic Hierarchical Perception for Multimodal Learning Xiongye Xiao Gengshuo Liu Gaurav Gupta De-An Cao Shixuan Li Yaxing Li Tianqing Fang Mingxi Cheng Paul Bogdan 92 9 0 15 Apr 2024
StreakNet-Arch: An Anti-scattering Network-based Architecture for Underwater Carrier LiDAR-Radar Imaging Xuelong Li Hongjun An Haofei Zhao Guangying Li Bo Liu Xing Wang Guanghua Cheng Guojun Wu Zhe Sun 87 0 0 14 Apr 2024
Trustworthy Multimodal Fusion for Sentiment Analysis in Ordinal Sentiment Space Zhuyang Xie Yan Yang Jie Wang Xiaorong Liu Xiaofan Li 69 8 0 13 Apr 2024
VertAttack: Taking advantage of Text Classifiers' horizontal vision Jonathan Rusert AAML 105 1 0 12 Apr 2024
MSciNLI: A Diverse Benchmark for Scientific Natural Language Inference Mobashir Sadat Cornelia Caragea 80 5 0 11 Apr 2024
LATTE: Low-Precision Approximate Attention with Head-wise Trainable Threshold for Efficient Transformer Jiing-Ping Wang Ming-Guang Lin An-Yeu Wu Wu 47 1 0 11 Apr 2024
Analyzing the Performance of Large Language Models on Code Summarization Rajarshi Haldar Julia Hockenmaier 73 19 0 10 Apr 2024
Xiwu: A Basis Flexible and Learnable LLM for High Energy Physics Zhengde Zhang Yiyu Zhang Haodong Yao Jianwen Luo Rui Zhao ... Ke Li Lina Zhao Jun Cao Fazhi Qi Changzheng Yuan 52 2 0 08 Apr 2024
Linguistic Changes in Spontaneous Speech for Detecting Parkinsons Disease Using Large Language Models Jonathan Crawford 60 0 0 08 Apr 2024
Contextual Chart Generation for Cyber Deception David D. Nguyen David Liebowitz Surya Nepal S. Kanhere Sharif Abuadbba 99 0 0 07 Apr 2024
A Morphology-Based Investigation of Positional Encodings Poulami Ghosh Shikhar Vashishth Raj Dabre Pushpak Bhattacharyya 75 2 0 06 Apr 2024
The Promises and Pitfalls of Using Language Models to Measure Instruction Quality in Education Paiheng Xu Jing Liu Nathan Jones Julie Cohen Wei Ai AI4Ed 110 7 0 03 Apr 2024
Enhancing Low-Resource LLMs Classification with PEFT and Synthetic Data Parth Patwa Simone Filice Zhiyu Zoey Chen Giuseppe Castellucci Oleg Rokhlenko S. Malmasi 75 7 0 03 Apr 2024
Revisiting subword tokenization: A case study on affixal negation in large language models Thinh Hung Truong Yulia Otmakhova Karin Verspoor Trevor Cohn Timothy Baldwin 75 2 0 03 Apr 2024
Toward Informal Language Processing: Knowledge of Slang in Large Language Models Zhewei Sun Qian Hu Rahul Gupta Richard Zemel Yang Xu 67 3 0 02 Apr 2024
Extracting Norms from Contracts Via ChatGPT: Opportunities and Challenges Amanul Haque Munindar P. Singh 66 4 0 02 Apr 2024
Improved Text Emotion Prediction Using Combined Valence and Arousal Ordinal Classification Michael Mitsios G. Vamvoukakis Georgia Maniati Nikolaos Ellinas Georgios Dimitriou ... Inchul Hwang Georgios Vardaxoglou Aimilios Chalamandaris Pirros Tsiakoulis S. Raptis 54 2 0 02 Apr 2024
Towards Generalizable and Faithful Logic Reasoning over Natural Language via Resolution Refutation Zhouhao Sun Xiao Ding Li Du Bibo Cai Jin-Fang Gao Ting Liu Bing Qin LRM ReLM 61 0 0 02 Apr 2024
A Survey on Patent Analysis: From NLP to Multimodal AI Homaira Huda Shomee Zhu Wang Sathya Ravi Sourav Medya 88 1 0 02 Apr 2024
AISPACE at SemEval-2024 task 8: A Class-balanced Soft-voting System for Detecting Multi-generator Machine-generated Text Renhua Gu Xiangfeng Meng DeLMO 77 4 0 01 Apr 2024
TM-TREK at SemEval-2024 Task 8: Towards LLM-Based Automatic Boundary Detection for Human-Machine Mixed Text Xiaoyan Qu Xiangfeng Meng DeLMO 76 2 0 01 Apr 2024
SpiralMLP: A Lightweight Vision MLP Architecture Haojie Mu Burhan Ul Tayyab Nicholas Chua 86 0 0 31 Mar 2024
MIPS at SemEval-2024 Task 3: Multimodal Emotion-Cause Pair Extraction in Conversations with Multimodal Language Models Zebang Cheng Fuqiang Niu Yuxiang Lin Zhi-Qi Cheng Bowen Zhang Xiaojiang Peng 85 7 0 31 Mar 2024
LayerNorm: A key component in parameter-efficient fine-tuning Taha ValizadehAslani Hualou Liang 85 1 0 29 Mar 2024
The Future of Combating Rumors? Retrieval, Discrimination, and Generation Junhao Xu Longdi Xian Zening Liu Mingliang Chen Qiuyang Yin Fenghua Song 68 2 0 29 Mar 2024
FACTOID: FACtual enTailment fOr hallucInation Detection Vipula Rawte S. M. Towhidul Krishnav Rajbangshi Shravani Nag Aman Chadha Amit P. Sheth Amitava Das HILM 86 4 0 28 Mar 2024
"Sorry, Come Again?" Prompting -- Enhancing Comprehension and Diminishing Hallucination with [PAUSE]-injected Optimal Paraphrasing Vipula Rawte Islam Tonmoy M. M. Zaman Prachi Priya Marcin Kardas Alan Schelten Ruan Silva LRM 54 1 0 27 Mar 2024
OmniVid: A Generative Framework for Universal Video Understanding Junke Wang Dongdong Chen Chong Luo Bo He Lu Yuan Zuxuan Wu Yu-Gang Jiang VLM VGen 119 16 0 26 Mar 2024
Domain Adaptation in Intent Classification Systems: A Review Jesse Atuhurra Hidetaka Kamigaito Taro Watanabe Eric Nichols 70 0 0 26 Mar 2024
EulerFormer: Sequential User Behavior Modeling with Complex Vector Attention Zhen Tian Wayne Xin Zhao Changwang Zhang Xin Zhao Zhongrui Ma Ji-Rong Wen 91 3 0 26 Mar 2024
Enhancing Visual Continual Learning with Language-Guided Supervision Bolin Ni Hongbo Zhao Chenghao Zhang Ke Hu Gaofeng Meng Zhaoxiang Zhang Shiming Xiang CLL VLM 135 4 0 24 Mar 2024
Opportunities and challenges in the application of large artificial intelligence models in radiology Liangrui Pan Zhenyu Zhao Ying Lu Kewei Tang Liyong Fu Qingchun Liang Shaoliang Peng LM&MA MedIm AI4CE 81 6 0 24 Mar 2024
LlamBERT: Large-scale low-cost data annotation in NLP Bálint Csanády Lajos Muzsai Péter Vedres Zoltán Nádasdy András Lukács 83 8 0 23 Mar 2024
EAGLE: A Domain Generalization Framework for AI-generated Text Detection Amrita Bhattacharjee Raha Moraffah Joshua Garland Huan Liu DeLMO 79 7 0 23 Mar 2024
SensoryT5: Infusing Sensorimotor Norms into T5 for Enhanced Fine-grained Emotion Classification Yuhan Xia Qingqing Zhao Yunfei Long Ge Xu Jia Wang 30 0 0 22 Mar 2024
Ax-to-Grind Urdu: Benchmark Dataset for Urdu Fake News Detection Sheetal Harris Jinshuo Liu Hassan Jalil Hadi Yue Cao 71 5 0 20 Mar 2024
Reverse Training to Nurse the Reversal Curse O. Yu. Golovneva Zeyuan Allen-Zhu Jason Weston Sainbayar Sukhbaatar 114 38 0 20 Mar 2024
Enhancing Traffic Incident Management with Large Language Models: A Hybrid Machine Learning Approach for Severity Classification Artur Grigorev Khaled Saleh Yuming Ou Adriana-Simona Mihaita 62 6 0 20 Mar 2024
Generalizable and Stable Finetuning of Pretrained Language Models on Low-Resource Texts Sai Ashish Somayajula Youwei Liang Abhishek Singh Li Zhang Pengtao Xie 80 2 0 19 Mar 2024
TT-BLIP: Enhancing Fake News Detection Using BLIP and Tri-Transformer Eunjee Choi Jong-Kook Kim 99 2 0 19 Mar 2024
Emotion Detection with Transformers: A Comparative Study Mahdi Rezapour 25 3 0 18 Mar 2024
RobustSentEmbed: Robust Sentence Embeddings Using Adversarial Self-Supervised Contrastive Learning J. Asl Prajwal Panzade Eduardo Blanco Daniel Takabi Zhipeng Cai SSL 43 2 0 17 Mar 2024
Enhanced Coherence-Aware Network with Hierarchical Disentanglement for Aspect-Category Sentiment Analysis Jin Cui Fumiyo Fukumoto Xinfeng Wang Yoshimi Suzuki Jiyi Li Noriko Tomuro Wanzeng Kong 50 2 0 15 Mar 2024
depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers Kaichao You Runsheng Bai Meng Cao Jianmin Wang Ion Stoica Mingsheng Long VLM 77 0 0 14 Mar 2024
Can LLM Substitute Human Labeling? A Case Study of Fine-grained Chinese Address Entity Recognition Dataset for UAV Delivery Yuxuan Yao Sichun Luo Haohan Zhao Guanzhi Deng Linqi Song 76 7 0 10 Mar 2024
Authorship Attribution in Bangla Literature (AABL) via Transfer Learning using ULMFiT Aisha Khatun Anisur Rahman Md. Saiful Islam Hemayet Ahmed Chowdhury A. Tasnim 69 3 0 08 Mar 2024
Denoising Autoregressive Representation Learning Yazhe Li J. Bornschein Ting Chen DiffM 84 4 0 08 Mar 2024