RoBERTa: A Robustly Optimized BERT Pretraining Approach

26 July 2019

Luke Zettlemoyer

Papers citing "RoBERTa: A Robustly Optimized BERT Pretraining Approach"

50 / 10,734 papers shown

Title
Open World Object Detection: A Survey Yiming Li Yi Wang Wenqian Wang Dan Lin Bingbing Li Kim-Hui Yap ObjD 88 1 0 01 Jul 2025
Mechanisms vs. Outcomes: Probing for Syntax Fails to Explain Performance on Targeted Syntactic Evaluations Ananth Agarwal Jasper Jian Christopher D. Manning Shikhar Murty 17 0 0 20 Jun 2025
With Limited Data for Multimodal Alignment, Let the STRUCTURE Guide You Fabian Gröger Shuo Wen Huyen Le Maria Brbic 22 0 0 20 Jun 2025
Enhancing Step-by-Step and Verifiable Medical Reasoning in MLLMs Haoran Sun Yankai Jiang Wenjie Lou Yujie Zhang Wenjie Li Lilong Wang Mianxin Liu Lei Liu Xiaosong Wang LRM 15 0 0 20 Jun 2025
Language-driven Description Generation and Common Sense Reasoning for Video Action Recognition Xiaodan Hu Chuhang Zou Suchen Wang Jaechul Kim Narendra Ahuja LRM 15 0 0 20 Jun 2025
Aligning ASR Evaluation with Human and LLM Judgments: Intelligibility Metrics Using Phonetic, Semantic, and NLI Approaches Bornali Phukon Xiuwen Zheng Mark Hasegawa-Johnson 15 0 0 19 Jun 2025
Probe before You Talk: Towards Black-box Defense against Backdoor Unalignment for Large Language Models Biao Yi Tiansheng Huang Sishuo Chen Tong Li Zheli Liu Zhixuan Chu Yiming Li AAML 24 9 0 19 Jun 2025
Cyberbullying Detection in Hinglish Text Using MURIL and Explainable AI Devesh Kumar 10 0 0 19 Jun 2025
Efficient and Privacy-Preserving Soft Prompt Transfer for LLMs Xun Wang Jing Xu Franziska Boenisch Michael Backes Christopher A. Choquette-Choo Adam Dziedzic AAML 28 0 0 19 Jun 2025
From LLM-anation to LLM-orchestrator: Coordinating Small Models for Data Labeling Yao Lu Zhaiyuan Ji Jiawei Du Yu Shanqing Qi Xuan Tianyi Zhou 20 0 0 19 Jun 2025
Modeling Public Perceptions of Science in Media Jiaxin Pei Dustin Wright Isabelle Augenstin David Jurgens 15 0 0 19 Jun 2025
PhantomHunter: Detecting Unseen Privately-Tuned LLM-Generated Text via Family-Aware Learning Yuhui Shi Yehan Yang Qiang Sheng Hao Mi Beizhe Hu Chaoxi Xu Juan Cao DeLMO 59 0 0 18 Jun 2025
SecFwT: Efficient Privacy-Preserving Fine-Tuning of Large Language Models Using Forward-Only Passes Jinglong Luo Zhuo Zhang Yehong Zhang Shiyu Liu Ye Dong Xun Zhou Hui Wang Yue Yu Zenglin Xu 15 0 0 18 Jun 2025
Entropy-Driven Pre-Tokenization for Byte-Pair Encoding Yifan Hu Frank Liang Dachuan Zhao Jonathan Geuter Varshini Reddy Craig W. Schmidt Chris Tanner 15 0 0 18 Jun 2025
Memory-Efficient Differentially Private Training with Gradient Random Projection Alex Mulrooney Devansh Gupta James Flemings Huanyu Zhang Murali Annavaram Meisam Razaviyayn Xinwei Zhang 27 0 0 18 Jun 2025
Enhancing Hyperbole and Metaphor Detection with Their Bidirectional Dynamic Interaction and Emotion Knowledge Li Zheng Sihang Wang Hao Fei Zuquan Peng Fei Li Jianming Fu Chong Teng Donghong Ji 15 0 0 18 Jun 2025
EVA02-AT: Egocentric Video-Language Understanding with Spatial-Temporal Rotary Positional Embeddings and Symmetric Optimization Xiaoqi Wang Yi Wang Lap-Pui Chau 30 0 0 17 Jun 2025
Combining Constrained and Unconstrained Decoding via Boosting: BoostCD and Its Application to Information Extraction Marija Sakota Robert West 15 0 0 17 Jun 2025
Unified Representation Space for 3D Visual Grounding Yinuo Zheng Lipeng Gu Honghua Chen Liangliang Nan Mingqiang Wei 21 0 0 17 Jun 2025
Chaining Event Spans for Temporal Relation Grounding Jongho Kim Dohyeon Lee Minsoo Kim Seung-won Hwang 27 0 0 17 Jun 2025
When Does Meaning Backfire? Investigating the Role of AMRs in NLI Junghyun Min Xiulin Yang Shira Wein LLMSV 39 0 0 17 Jun 2025
SCISSOR: Mitigating Semantic Bias through Cluster-Aware Siamese Networks for Robust Classification Shuo Yang Bardh Prenkaj Gjergji Kasneci 29 0 0 17 Jun 2025
Thunder-NUBench: A Benchmark for LLMs' Sentence-Level Negation Understanding Yeonkyoung So Gyuseong Lee Sungmok Jung Joonhak Lee JiA Kang Sangho Kim Jaejin Lee 33 0 0 17 Jun 2025
FedOne: Query-Efficient Federated Learning for Black-box Discrete Prompt Learning Ganyu Wang Jinjie Fang Maxwell J. Ying Bin Gu Xi Chen Boyu Wang Charles Ling FedML 24 0 0 17 Jun 2025
ASMR: Augmenting Life Scenario using Large Generative Models for Robotic Action Reflection Shang-Chi Tsai Seiya Kawano Angel García Contreras Koichiro Yoshino Yun-Nung Chen LM&Ro 35 2 0 16 Jun 2025
Antibody Foundational Model : Ab-RoBERTa Eunna Huh Hyeonsu Lee Hyunjin Shin 15 0 0 16 Jun 2025
Dynamic Context-oriented Decomposition for Task-aware Low-rank Adaptation with Less Forgetting and Faster Convergence Yibo Yang Sihao Liu Chuan Rao Bang An Tiancheng Shen Philip Torr Ming-Hsuan Yang Bernard Ghanem 24 0 0 16 Jun 2025
Assessing the Limits of In-Context Learning beyond Functions using Partially Ordered Relation Debanjan Dutta Faizanuddin Ansari Swagatam Das 20 0 0 16 Jun 2025
Watermarking LLM-Generated Datasets in Downstream Tasks Y. Liu Tianshuo Cong Michael Backes Zheng Li Yang Zhang WaLM 41 0 0 16 Jun 2025
Medical Argument Mining: Exploitation of Scarce Data Using NLI Systems Maitane Urruela Sergio Martín Iker de la Iglesia Ander Barrena 22 0 0 15 Jun 2025
LLMs Struggle to Perform Counterfactual Reasoning with Parametric Knowledge Khurram Yamin Gaurav R. Ghosal Bryan Wilder LRM 18 0 0 15 Jun 2025
GSDNet: Revisiting Incomplete Multimodal-Diffusion from Graph Spectrum Perspective for Conversation Emotion Recognition Yuntao Shou Jun Yao Tao Meng Wei Ai Cen Chen Keqin Li DiffM 31 0 0 14 Jun 2025
Profiling News Media for Factuality and Bias Using LLMs and the Fact-Checking Methodology of Human Experts Zain Muhammad Mujahid Dilshod Azizov Maha Tufail Agro Preslav Nakov 15 0 0 14 Jun 2025
INTERPOS: Interaction Rhythm Guided Positional Morphing for Mobile App Recommender Systems M. H. Maqbool Moghis Fereidouni Umar Farooq A.B. Siddique H. Foroosh AI4TS 15 0 0 14 Jun 2025
A Variational Approach for Mitigating Entity Bias in Relation Extraction Samuel Mensah Elena Kochkina Jabez Magomere Joy Prakash Sain Simerjot Kaur Charese Smiley 64 0 0 13 Jun 2025
Today's Cat Is Tomorrow's Dog: Accounting for Time-Based Changes in the Labels of ML Vulnerability Detection Approaches Ranindya Paramitha Yuan Feng Fabio Massacci MLAU 30 0 0 13 Jun 2025
Addressing Bias in LLMs: Strategies and Application to Fair AI-based Recruitment Alejandro Peña Julian Fierrez Aythami Morales Gonzalo Mancera Miguel Lopez Ruben Tolosana 20 0 0 13 Jun 2025
Hatevolution: What Static Benchmarks Don't Tell Us Chiara Di Bonaventura Barbara McGillivray Yulan He Albert Meroño-Peñuela 20 0 0 13 Jun 2025
Generative or Discriminative? Revisiting Text Classification in the Era of Transformers Siva Rajesh Kasa Karan Gupta Sumegh Roychowdhury Ashutosh Kumar Yaswanth Biruduraju Santhosh Kumar Kasa Nikhil Pattisapu Arindam Bhattacharya Shailendra Agarwal Vijay huddar 15 0 0 13 Jun 2025
TongSearch-QR: Reinforced Query Reasoning for Retrieval Xubo Qin Jun Bai Jiaqi Li Zixia Jia Zilong Zheng ReLM RALM LRM 47 0 0 13 Jun 2025
GeistBERT: Breathing Life into German NLP Raphael Scheible-Schmitt Johann Frei VLM 35 0 0 13 Jun 2025
Manager: Aggregating Insights from Unimodal Experts in Two-Tower VLMs and MLLMs Xiao Xu L. Qin Wanxiang Che Min-Yen Kan MoE VLM 30 0 0 13 Jun 2025
Detecting Sockpuppetry on Wikipedia Using Meta-Learning Luc Raszewski Christine De Kock 113 0 0 12 Jun 2025
Efficiency Robustness of Dynamic Deep Learning Systems Ravishka Rathnasuriya Tingxi Li Zexin Xu Zihe Song Mirazul Haque Simin Chen Wei Yang AAML SILM 150 0 0 12 Jun 2025
Spelling-out is not Straightforward: LLMs' Capability of Tokenization from Token to Characters Tatsuya Hiraoka Kentaro Inui 121 0 0 12 Jun 2025
FASCIST-O-METER: Classifier for Neo-fascist Discourse Online Rudy Alexandro Garrido Veliz Martin Semmann Chris Biemann Seid Muhie Yimam 122 0 0 12 Jun 2025
SOFT: Selective Data Obfuscation for Protecting LLM Fine-tuning against Membership Inference Attacks Kaiyuan Zhang Siyuan Cheng Hanxi Guo Yuetian Chen Zian Su ... Yuntao Du Charles Fleming Ashish Kundu Xiangyu Zhang Ninghui Li AAML 144 0 0 12 Jun 2025
Flick: Few Labels Text Classification using K-Aware Intermediate Learning in Multi-Task Low-Resource Languages Ali Almutairi Abdullah Alsuhaibani Shoaib Jameel Usman Naseem Gelareh Mohammadi Imran Razzak VLM 131 0 0 12 Jun 2025
Incorporating Linguistic Constraints from External Knowledge Source for Audio-Visual Target Speech Extraction Wenxuan Wu Shuai Wang Xixin Wu Helen Meng Haizhou Li 76 0 0 11 Jun 2025
Private Aggregation for Byzantine-Resilient Heterogeneous Federated Learning Maximilian Egger Rawad Bitar 84 0 0 11 Jun 2025