RoBERTa: A Robustly Optimized BERT Pretraining Approach

26 July 2019

Luke Zettlemoyer

Papers citing "RoBERTa: A Robustly Optimized BERT Pretraining Approach"

50 / 10,734 papers shown

Title
Truth or Twist? Optimal Model Selection for Reliable Label Flipping Evaluation in LLM-based Counterfactuals Qianli Wang Van Bach Nguyen Nils Feldhus Luis Felipe Villa-Arenas Christin Seifert Sebastian Möller Vera Schmitt 64 0 0 20 May 2025
MoMoE: Mixture of Moderation Experts Framework for AI-Assisted Online Governance Agam Goyal Xianyang Zhan Yilun Chen Koustuv Saha Eshwar Chandrasekharan MoE 61 1 0 20 May 2025
Enhancing Abstractive Summarization of Scientific Papers Using Structure Information Tong Bao Heng Zhang Chengzhi Zhang 210 3 0 20 May 2025
Enhanced Multimodal Aspect-Based Sentiment Analysis by LLM-Generated Rationales Jun Cao Jiyi Li Ziwei Yang Renjie Zhou 187 0 0 20 May 2025
Exploring Graph Representations of Logical Forms for Language Modeling Michael Sullivan AI4CE 49 0 0 20 May 2025
SDLog: A Deep Learning Framework for Detecting Sensitive Information in Software Logs Roozbeh Aghili Xingfang Wu Foutse Khomh Heng Li 111 0 0 20 May 2025
LEANCODE: Understanding Models Better for Code Simplification of Pre-trained Large Language Models Yan Wang Ling Ding Tien N Nguyen Shaohua Wang Yanan Zheng 52 0 0 20 May 2025
Field Matters: A lightweight LLM-enhanced Method for CTR Prediction Yu Cui Feng Liu Jiawei Chen Yudi Wu Changwang Zhang Jun Wang Yuegang Sun Xiaohu Yang Can Wang 114 0 0 20 May 2025
Interpretable Dual-Stream Learning for Local Wind Hazard Prediction in Vulnerable Communities Mahmuda Akhter Nishu Chenyu Huang Milad Roohi Agnibh Dasgupta 30 0 0 20 May 2025
FAID: Fine-grained AI-generated Text Detection using Multi-task Auxiliary and Multi-level Contrastive Learning Minh Ngoc Ta Dong Cao Van Duc-Anh Hoang Minh Le-Anh Truong Nguyen My Anh Tran Nguyen Yuxia Wang Preslav Nakov Sang Dinh 66 0 0 20 May 2025
Multimodal Mixture of Low-Rank Experts for Sentiment Analysis and Emotion Recognition Shuo Zhang Jinsong Zhang Zhejun Zhang Lei Li MoE 55 0 0 20 May 2025
Plane Geometry Problem Solving with Multi-modal Reasoning: A Survey Seunghyuk Cho Zhenyue Qin Yang Liu Youngbin Choi Seungbeom Lee Dongwoo Kim LRM 108 0 0 20 May 2025
Unveil Multi-Picture Descriptions for Multilingual Mild Cognitive Impairment Detection via Contrastive Learning Kristin Qi Jiali Cheng Youxiang Zhu Hadi Amiri Xiaohui Liang 109 0 0 19 May 2025
EAVIT: Efficient and Accurate Human Value Identification from Text data via LLMs Wenhao Zhu Yuhang Xie Guojie Song Xin Zhang 88 0 0 19 May 2025
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA Seanie Lee Sangwoo Park Dong Bok Lee Dominik Wagner Haebin Seong Tobias Bocklet Juho Lee Sung Ju Hwang FedML 104 0 0 19 May 2025
GDPRShield: AI-Powered GDPR Support for Software Developers in Small and Medium-Sized Enterprises Tharaka Wijesundara Mathew Warren Nalin Arachchilage 99 0 0 19 May 2025
To Bias or Not to Bias: Detecting bias in News with bias-detector Himel Ghosh Ahmed Mosharafa Georg Groh 83 0 0 19 May 2025
Stronger Together: Unleashing the Social Impact of Hate Speech Research Sidney Wong 26 0 0 19 May 2025
SynDec: A Synthesize-then-Decode Approach for Arbitrary Textual Style Transfer via Large Language Models Han Sun Zhen Sun Zikai Zhang Linzhao Jia Wei Shao Min Zhang 67 0 0 19 May 2025
Large Language Models and Their Applications in Roadway Safety and Mobility Enhancement: A Comprehensive Review Muhammad Monjurul Karim Yan Shi Shucheng Zhang Bingzhang Wang Mehrdad Nasri Yinhai Wang 26 0 0 19 May 2025
Make Still Further Progress: Chain of Thoughts for Tabular Data Leaderboard Si-Yang Liu Qile Zhou Han-Jia Ye LMTD LRM 118 0 0 19 May 2025
Suicide Risk Assessment Using Multimodal Speech Features: A Study on the SW1 Challenge Dataset Ambre Marie Ilias Maoudj Guillaume Dardenne Gwenolé Quellec 50 0 0 19 May 2025
Think Before You Attribute: Improving the Performance of LLMs Attribution Systems João Eduardo Batista Emil Vatai Mohamed Wahib 204 0 0 19 May 2025
Towards DS-NER: Unveiling and Addressing Latent Noise in Distant Annotations Yuyang Ding Dan Qiao Jilong Li Jiajie Xu Pingfu Chao Xiaofang Zhou Min Zhang 60 1 0 18 May 2025
Bidirectional LMs are Better Knowledge Memorizers? A Benchmark for Real-world Knowledge Injection Yuwei Zhang Wenhao Yu Shangbin Feng Yifan Zhu Letian Peng Jayanth Srinivasa Gaowen Liu Jingbo Shang KELM 73 2 0 18 May 2025
Mitigating Hallucinations via Inter-Layer Consistency Aggregation in Large Vision-Language Models Kai Tang Jinhao You Xiuqi Ge Hanze Li Yichen Guo Xiande Huang MLLM 173 0 0 18 May 2025
SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization Minghan Chen Guikun Chen Wenguan Wang Yi Yang 97 3 0 18 May 2025
Information Extraction from Visually Rich Documents using LLM-based Organization of Documents into Independent Textual Segments Aniket Bhattacharyya Anurag Tripathi Ujjal Das Archan Karmakar Amit Pathak Maneesh Gupta 66 0 0 18 May 2025
Bridging Generative and Discriminative Learning: Few-Shot Relation Extraction via Two-Stage Knowledge-Guided Pre-training Quanjiang Guo Jinchuan Zhang Sijie Wang Ling Tian Zhao Kang Bin Yan Weidong Xiao 72 1 0 18 May 2025
Spatial-LLaVA: Enhancing Large Language Models with Spatial Referring Expressions for Visual Understanding Xuefei Sun Doncey Albin Cecilia Mauceri Dusty Woods Christoffer Heckman LRM 46 0 0 18 May 2025
Behind the Screens: Uncovering Bias in AI-Driven Video Interview Assessments Using Counterfactuals Dena F. Mujtaba Nihar R. Mahapatra 83 0 0 17 May 2025
Towards Comprehensive Argument Analysis in Education: Dataset, Tasks, and Method Yupei Ren Xinyi Zhou Ning Zhang Shangqing Zhao Man Lan Xiaopeng Bai 49 0 0 17 May 2025
A Multi-Task Benchmark for Abusive Language Detection in Low-Resource Settings Fitsum Gaim Hoyun Song Huije Lee Changgeon Ko Eui Jun Hwang Jong C. Park 76 0 0 17 May 2025
Towards Cross-modal Retrieval in Chinese Cultural Heritage Documents: Dataset and Solution Junyi Yuan Jian Zhang Fangyu Wu Dongming Lu Huanda Lu Qiufeng Wang 93 0 0 16 May 2025
MergeBench: A Benchmark for Merging Domain-Specialized LLMs Yifei He Siqi Zeng Yuzheng Hu Rui Yang Tong Zhang Han Zhao MoMe ALM 108 0 0 16 May 2025
MPPFND: A Dataset and Analysis of Detecting Fake News with Multi-Platform Propagation Congyuan Zhao Lingwei Wei Ziming Qin Wei Zhou Yunya Song Songlin Hu 36 0 0 16 May 2025
On the Interconnections of Calibration, Quantification, and Classifier Accuracy Prediction under Dataset Shift Alejandro Moreo 50 0 0 16 May 2025
An empirical study of task and feature correlations in the reuse of pre-trained models Jama Hussein Mohamud Willie Brink 26 0 0 15 May 2025
A Scalable Unsupervised Framework for multi-aspect labeling of Multilingual and Multi-Domain Review Data Jiin Park Misuk Kim 67 0 0 14 May 2025
Ornithologist: Towards Trustworthy "Reasoning" about Central Bank Communications Dominic Zaun Eu Jones 74 0 0 14 May 2025
Automated Detection of Clinical Entities in Lung and Breast Cancer Reports Using NLP Techniques J. Moreno-Casanova J.M. Auñón A. Mártinez-Pérez M.E. Pérez-Martínez M.E. Gas-López 24 0 0 14 May 2025
Contrastive Cross-Course Knowledge Tracing via Concept Graph Guided Knowledge Transfer Wenkang Han Wang Lin Liya Hu Zhenlong Dai Yiyun Zhou Mengze Li Zemin Liu Chang Yao Jingyuan Chen AI4Ed 87 0 0 14 May 2025
Analog Foundation Models Julian Büchel Iason Chalas Giovanni Acampa An Chen Omobayode Fagbohungbe Sidney Tsai Kaoutar El Maghraoui Manuel Le Gallo Abbas Rahimi Abu Sebastian MQ 115 0 0 14 May 2025
Structural-Temporal Coupling Anomaly Detection with Dynamic Graph Transformer Chang Zong Yueting Zhuang Jian Shao Weiming Lu 89 0 0 13 May 2025
Large Language Models Meet Stance Detection: A Survey of Tasks, Methods, Applications, Challenges and Future Directions Lata Pangtey Anukriti Bhatnagar Shubhi Bansal Shahid Shafi Dar Nagendra Kumar 75 0 0 13 May 2025
Exploiting Text Semantics for Few and Zero Shot Node Classification on Text-attributed Graph Yuxiang Wang Xiao Yan Shiyu Jin Quanqing Xu Chuang Hu Yuanyuan Zhu Bo Du Hongzhi Zhang Wentao Zhang 63 0 0 13 May 2025
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models Takumi Shibata Yuichi Miyamura 118 0 0 13 May 2025
Next Word Suggestion using Graph Neural Network Abisha Thapa Magar Anup Shakya GNN 58 0 0 13 May 2025
TiSpell: A Semi-Masked Methodology for Tibetan Spelling Correction covering Multi-Level Error with Data Augmentation Yutong Liu Feng Xiao Ziyue Zhang Yongbin Yu Cheng Huang ... Thupten Tsering Cheng Huang Gadeng Luosang Renzeng Duojie Nyima Tashi 62 2 0 12 May 2025
DynamicRAG: Leveraging Outputs of Large Language Model as Feedback for Dynamic Reranking in Retrieval-Augmented Generation Jimeng Sun Xianrui Zhong Sizhe Zhou Jiawei Han RALM 75 0 0 12 May 2025