RoBERTa: A Robustly Optimized BERT Pretraining Approach

26 July 2019

Luke Zettlemoyer

Papers citing "RoBERTa: A Robustly Optimized BERT Pretraining Approach"

50 / 10,734 papers shown

Title
Incorporating Linguistic Constraints from External Knowledge Source for Audio-Visual Target Speech Extraction Wenxuan Wu Shuai Wang Xixin Wu Helen Meng Haizhou Li 76 0 0 11 Jun 2025
EfficientVLA: Training-Free Acceleration and Compression for Vision-Language-Action Models Yantai Yang Yuhao Wang Zichen Wen Luo Zhongwei Chang Zou Zhipeng Zhang Chuan Wen Linfeng Zhang VLM 74 0 0 11 Jun 2025
CoMuMDR: Code-mixed Multi-modal Multi-domain corpus for Discourse paRsing in conversations Divyaksh Shukla Ritesh Baviskar Dwijesh Gohil Aniket Tiwari Atul Shree Ashutosh Modi 38 0 0 10 Jun 2025
TrajFlow: Multi-modal Motion Prediction via Flow Matching Qi Yan Brian Zhang Yutong Zhang Daniel Yang Joshua White ... Jiachao Liu Langechuan Liu Binnan Zhuang Shaoshuai Shi Renjie Liao 17 0 0 10 Jun 2025
Detecting Harmful Memes with Decoupled Understanding and Guided CoT Reasoning Fengjun Pan Anh Tuan Luu Xiaobao Wu 28 0 0 10 Jun 2025
Explainable Compliance Detection with Multi-Hop Natural Language Inference on Assurance Case Structure Fariz Ikhwantri Dusica Marijan 18 0 0 10 Jun 2025
Olica: Efficient Structured Pruning of Large Language Models without Retraining Jiujun He Huazhen Lin 24 0 0 10 Jun 2025
CAF-I: A Collaborative Multi-Agent Framework for Enhanced Irony Detection with Large Language Models Ziqi.Liu Ziyang.Zhou Mingxuan.Hu 22 0 0 10 Jun 2025
CC-RAG: Structured Multi-Hop Reasoning via Theme-Based Causal Graphs Jash Rajesh Parekh Pengcheng Jiang Jiawei Han LRM 22 0 0 10 Jun 2025
Multimodal Representation Alignment for Cross-modal Information Retrieval Fan Xu Luis A. Leiva 17 0 0 10 Jun 2025
Fairness is Not Silence: Unmasking Vacuous Neutrality in Small Language Models Sumanth Manduru Carlotta Domeniconi ALM 13 0 0 10 Jun 2025
"I wasn't sure if this is indeed a security risk": Data-driven Understanding of Security Issue Reporting in GitHub Repositories of Open Source npm Packages Rajdeep Ghosh Shiladitya De Mainack Mondal 25 0 0 09 Jun 2025
Plug-in and Fine-tuning: Bridging the Gap between Small Language Models and Large Language Models Kyeonghyun Kim Jinhee Jang Juhwan Choi Yoonji Lee Kyohoon Jin Youngbin Kim 24 0 0 09 Jun 2025
GradEscape: A Gradient-Based Evader Against AI-Generated Text Detectors Wenlong Meng Shuguo Fan Chengkun Wei Min Chen Yuwei Li Yuanchao Zhang Zhikun Zhang Wenzhi Chen 17 0 0 09 Jun 2025
Ambiguity-Restrained Text-Video Representation Learning for Partially Relevant Video Retrieval CH Cho WJ Moon W Jun MS Jung JP Heo 15 0 0 09 Jun 2025
PrunePEFT: Iterative Hybrid Pruning for Parameter-Efficient Fine-tuning of LLMs Tongzhou Yu Zhuhao Zhang Guanghui Zhu Shen Jiang Meikang Qiu Yihua Huang 36 0 0 09 Jun 2025
LoRMA: Low-Rank Multiplicative Adaptation for LLMs Harsh Bihany Shubham Patel Ashutosh Modi 22 0 0 09 Jun 2025
TokenBreak: Bypassing Text Classification Models Through Token Manipulation Kasimir Schulz Kenneth Yeung Kieran Evans SILM 13 0 0 09 Jun 2025
Label-semantics Aware Generative Approach for Domain-Agnostic Multilabel Classification Subhendu Khatuya Shashwat Naidu Saptarshi Ghosh Pawan Goyal Niloy Ganguly VLM 25 0 0 07 Jun 2025
Advancing Question Generation with Joint Narrative and Difficulty Control Bernardo Leite Henrique Lopes Cardoso 23 0 0 07 Jun 2025
Hybrid Extractive Abstractive Summarization for Multilingual Sentiment Analysis Mikhail Krasitskii Grigori Sidorov Olga Kolesnikova Liliana Chanona Hernandez Alexander Gelbukh 18 0 0 07 Jun 2025
MarginSel : Max-Margin Demonstration Selection for LLMs Rajeev Bhatt Ambati James Lester Shashank Srivastava Snigdha Chaturvedi 33 0 0 07 Jun 2025
Let's CONFER: A Dataset for Evaluating Natural Language Inference Models on CONditional InFERence and Presupposition Tara Azin Daniel Dumitrescu Diana Inkpen Raj Singh 30 0 0 06 Jun 2025
Explaining Matters: Leveraging Definitions and Semantic Expansion for Sexism Detection Sahrish Khan Arshad Jhumka Gabriele Pergola 56 0 0 06 Jun 2025
Masked Language Models are Good Heterogeneous Graph Generalizers Jinyu Yang Cheng Yang Shanyuan Cui Zeyuan Guo Liangwei Yang Muhan Zhang Chuan Shi 70 0 0 06 Jun 2025
A Culturally-Rich Romanian NLP Dataset from "Who Wants to Be a Millionaire?" Videos Alexandru-Gabriel Ganea Antonia-Adelina Popovici Adrian-Marius Dumitran 46 0 0 06 Jun 2025
Towards an Explainable Comparison and Alignment of Feature Embeddings Mohammad Jalali Bahar Dibaei Nia Farzan Farnia 53 0 0 06 Jun 2025
Mitigating Catastrophic Forgetting with Adaptive Transformer Block Expansion in Federated Fine-Tuning Yujia Huo Jianchun Liu Hongli Xu Zhenguo Ma Shilong Wang Liusheng Huang CLL 45 0 0 06 Jun 2025
Unleashing the Potential of Consistency Learning for Detecting and Grounding Multi-Modal Media Manipulation Yiheng Li Yang Yang Zichang Tan Huan Liu Weihua Chen Xu Zhou Zhen Lei 77 0 0 06 Jun 2025
Mitigating Confounding in Speech-Based Dementia Detection through Weight Masking Zhecheng Sheng Xiruo Ding Brian Hur Changye Li Trevor Cohen Serguei V. S. Pakhomov 30 0 0 05 Jun 2025
SoK: Are Watermarks in LLMs Ready for Deployment? Kieu Dang Phung Lai Nhathai Phan Yelong Shen Ruoming Jin Abdallah Khreishah My T. Thai 35 0 0 05 Jun 2025
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs Ananth Muppidi Abhilash Nandy Sambaran Bandyopadhyay 24 0 0 05 Jun 2025
Lifelong Evolution: Collaborative Learning between Large and Small Language Models for Continuous Emergent Fake News Detection Ziyi Zhou Xiaoming Zhang Litian Zhang Yibo Zhang Zhenyu Guan Chaozhuo Li Philip S. Yu 88 0 0 05 Jun 2025
A MISMATCHED Benchmark for Scientific Natural Language Inference Firoz Shaik Mobashir Sadat Nikita Gautam Doina Caragea Cornelia Caragea 82 0 0 05 Jun 2025
Improving Low-Resource Morphological Inflection via Self-Supervised Objectives Adam Wiemerslage Katharina von der Wense 105 0 0 05 Jun 2025
Grounding Beyond Detection: Enhancing Contextual Understanding in Embodied 3D Grounding Yani Zhang Dongming Wu Hao Shi Yingfei Liu Tiancai Wang Haoqiang Fan Xingping Dong ObjD 108 0 0 05 Jun 2025
MamFusion: Multi-Mamba with Temporal Fusion for Partially Relevant Video Retrieval Xinru Ying Jiaqi Mo Jingyang Lin Canghong Jin Fangfang Wang Lina Wei 69 0 0 04 Jun 2025
Hanging in the Balance: Pivotal Moments in Crisis Counseling Conversations Vivian Nguyen Lillian Lee Cristian Danescu-Niculescu-Mizil 68 0 0 04 Jun 2025
Prompt Candidates, then Distill: A Teacher-Student Framework for LLM-driven Data Annotation Mingxuan Xia Haobo Wang Yixuan Li Zewei Yu Jindong Wang Junbo Zhao Runze Wu 94 1 0 04 Jun 2025
Explainable AI: XAI-Guided Context-Aware Data Augmentation Melkamu Mersha M. Yigezu A. Tonja Hassan Shakil Samer Iskander Olga Kolesnikova Jugal Kalita 184 0 0 04 Jun 2025
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order Egor Petrov Grigoriy Evseev Aleksey Antonov Andrey Veprikov Pavel Plyusnin Nikolay Bushkov Stanislav Moiseev Aleksandr Beznosikov 79 0 0 04 Jun 2025
KG-BiLM: Knowledge Graph Embedding via Bidirectional Language Models Zirui Chen Xin Eric Wang Zhao Li Wenbin Guo Dongxiao He 106 0 0 04 Jun 2025
Evaluating Apple Intelligence's Writing Tools for Privacy Against Large Language Model-Based Inference Attacks: Insights from Early Datasets Mohd. Farhan Israk Soumik Syed Mhamudul Hasan Abdur R. Shahid 97 0 0 04 Jun 2025
AuthGuard: Generalizable Deepfake Detection via Language Guidance Guangyu Shen Zhihua Li Xiang Xu Tianchen Zhao Zheng Zhang Dongsheng An Zhuowen Tu Yifan Xing Qin Zhang 23 0 0 04 Jun 2025
Measuring Human Involvement in AI-Generated Text: A Case Study on Academic Writing Yuchen Guo Zhicheng Dou H. Nguyen Ching-Chun Chang Saku Sugawara Isao Echizen DeLMO 110 0 0 04 Jun 2025
Rethinking the effects of data contamination in Code Intelligence Zhen Yang Hongyi Lin Yifan He Jie Xu Zeyu Sun Shuo Liu P. Wang Zhongxing Yu Qingyuan Liang 48 0 0 03 Jun 2025
HACo-Det: A Study Towards Fine-Grained Machine-Generated Text Detection under Human-AI Coauthoring Zhixiong Su Yichen Wang Herun Wan Zhaohan Zhang Minnan Luo DeLMO 57 0 0 03 Jun 2025
QKV Projections Require a Fraction of Their Memory Malik Khalf Yara Shamshoum Nitzan Hodos Yuval Sieradzki Assaf Schuster MQ VLM 68 0 0 03 Jun 2025
Design of Trimmed Helicoid Soft-Rigid Hybrid Robots Zach J. Patterson Emily R. Sologuren Daniela Rus 37 0 0 03 Jun 2025
Natural Language Processing to Enhance Deliberation in Political Online Discussions: A Survey Maike Behrendt Stefan Sylvius Wagner Carina Weinmann Marike Bormann Mira Warne Stefan Harmeling 55 0 0 03 Jun 2025