v1v2 (latest)

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

11 October 2018

Papers citing "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

50 / 23,491 papers shown

Title
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation Zhuguanyu Wu Shihe Wang Jiayi Zhang Jiaxin Chen Yunhong Wang MQ 23 0 0 13 Jun 2025
Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study Greta Damo Elena Cabrio S. Villata 20 0 0 13 Jun 2025
Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis Yuan Gao Mattia Piccinini Yuchen Zhang Dingrui Wang Korbinian Moller ... Steven Peters Andrea Stocco Bassam Alrifaee Marco Pavone Johannes Betz 30 0 0 13 Jun 2025
Manager: Aggregating Insights from Unimodal Experts in Two-Tower VLMs and MLLMs Xiao Xu L. Qin Wanxiang Che Min-Yen Kan MoE VLM 36 0 0 13 Jun 2025
Improving Causal Interventions in Amnesic Probing with Mean Projection or LEACE Alicja Dobrzeniecka Antske Fokkens Pia Sommerauer 17 0 0 13 Jun 2025
On the Effectiveness of Integration Methods for Multimodal Dialogue Response Retrieval Seongbo Jang Seonghyeon Lee Dongha Lee Hwanjo Yu 23 0 0 13 Jun 2025
Addressing Bias in LLMs: Strategies and Application to Fair AI-based Recruitment Alejandro Peña Julian Fierrez Aythami Morales Gonzalo Mancera Miguel Lopez Ruben Tolosana 22 0 0 13 Jun 2025
GeistBERT: Breathing Life into German NLP Raphael Scheible-Schmitt Johann Frei VLM 39 0 0 13 Jun 2025
Generative or Discriminative? Revisiting Text Classification in the Era of Transformers Siva Rajesh Kasa Karan Gupta Sumegh Roychowdhury Ashutosh Kumar Yaswanth Biruduraju Santhosh Kumar Kasa Nikhil Pattisapu Arindam Bhattacharya Shailendra Agarwal Vijay huddar 27 0 0 13 Jun 2025
Brewing Knowledge in Context: Distillation Perspectives on In-Context Learning Chengye Li Haiyun Liu Yuanxi Li 24 0 0 13 Jun 2025
Coefficient Shape Transfer Learning for Functional Linear Regression Shuhao Jiao Ian W. Mckeague N. Chan 20 0 0 13 Jun 2025
Towards Robust Multimodal Emotion Recognition under Missing Modalities and Distribution Shifts Guowei Zhong Ruohong Huan Mingzhen Wu Ronghua Liang Peng Chen 128 0 0 12 Jun 2025
Spelling-out is not Straightforward: LLMs' Capability of Tokenization from Token to Characters Tatsuya Hiraoka Kentaro Inui 127 0 0 12 Jun 2025
FASCIST-O-METER: Classifier for Neo-fascist Discourse Online Rudy Alexandro Garrido Veliz Martin Semmann Chris Biemann Seid Muhie Yimam 124 0 0 12 Jun 2025
Large Language Models for Detection of Life-Threatening Texts Thanh Thi Nguyen Campbell Wilson Janis Dalins 121 0 0 12 Jun 2025
Fine-Grained Perturbation Guidance via Attention Head Selection Donghoon Ahn Jiwon Kang Sanghyun Lee Minjae Kim Jaewon Min Wooseok Jang Saungwu Lee Sayak Paul S. Hong Seungryong Kim DiffM AAML 131 0 0 12 Jun 2025
Joint ASR and Speaker Role Tagging with Serialized Output Training Anfeng Xu Tiantian Feng Shrikanth Narayanan 108 0 0 12 Jun 2025
AI-Based Software Vulnerability Detection: A Systematic Literature Review Samiha Shimmi Hamed Okhravi Mona Rahimi 126 0 0 12 Jun 2025
Flick: Few Labels Text Classification using K-Aware Intermediate Learning in Multi-Task Low-Resource Languages Ali Almutairi Abdullah Alsuhaibani Shoaib Jameel Usman Naseem Gelareh Mohammadi Imran Razzak VLM 135 0 0 12 Jun 2025
Improving Group Robustness on Spurious Correlation via Evidential Alignment Wenqian Ye Guangtao Zheng Aidong Zhang 27 0 0 12 Jun 2025
Iterative Multilingual Spectral Attribute Erasure Shun Shao Yftah Ziser Zheng Zhao Yifu Qiu Shay B. Cohen Anna Korhonen 19 0 0 12 Jun 2025
ClimateChat: Designing Data and Methods for Instruction Tuning LLMs to Answer Climate Change Queries Zhou Chen Xiao Wang Yuanhong Liao Ming Lin Yuqi Bai 18 1 0 12 Jun 2025
Detecting Sockpuppetry on Wikipedia Using Meta-Learning Luc Raszewski Christine De Kock 129 0 0 12 Jun 2025
ViLLa: A Neuro-Symbolic approach for Animal Monitoring Harsha Koduri 14 0 0 12 Jun 2025
Multi-Timescale Dynamics Model Bayesian Optimization for Plasma Stabilization in Tokamaks Rohit Sonker Alexandre Capone Andrew Rothstein Hiro Josep Farre Kaga E. Kolemen J. Schneider AI4CE 126 0 0 12 Jun 2025
Task Adaptation from Skills: Information Geometry, Disentanglement, and New Objectives for Unsupervised Reinforcement Learning Yucheng Yang Tianyi Zhou Qiang He Lei Han Mykola Pechenizkiy Meng Fang SSL 110 7 0 12 Jun 2025
Semantic Localization Guiding Segment Anything Model For Reference Remote Sensing Image Segmentation Shuyang Li Shuang Wang Zhuangzhuang Sun Jing Xiao VLM 103 0 0 12 Jun 2025
Preserving Task-Relevant Information Under Linear Concept Removal Floris Holstege Shauli Ravfogel Bram Wouters KELM 136 0 0 12 Jun 2025
You Are What You Say: Exploiting Linguistic Content for VoicePrivacy Attacks Ünal Ege Gaznepoglu Anna Leschanowsky Ahmad Aloradi Prachi Singh D. K T Emanuël A. P. Habets Nils Peters 66 0 0 11 Jun 2025
The Emergence of Abstract Thought in Large Language Models Beyond Any Language Yuxin Chen Yiran Zhao Yang Zhang An Zhang Kenji Kawaguchi Shafiq Joty Junnan Li Tat-Seng Chua Michael Shieh Wenxuan Zhang LRM 65 0 0 11 Jun 2025
Q2E: Query-to-Event Decomposition for Zero-Shot Multilingual Text-to-Video Retrieval Shubhashis Roy Dipta Francis Ferraro 53 0 0 11 Jun 2025
From Judgment to Interference: Early Stopping LLM Harmful Outputs via Streaming Content Monitoring Yang Li Qiang Sheng Yehan Yang Xueyao Zhang Juan Cao 91 0 0 11 Jun 2025
From Intention to Execution: Probing the Generalization Boundaries of Vision-Language-Action Models Irving Fang Juexiao Zhang Shengbang Tong Chen Feng LM&Ro 63 1 0 11 Jun 2025
Enhancing Traffic Accident Classifications: Application of NLP Methods for City Safety Enes Özeren Alexander Ulbrich Sascha Filimon David Rügamer Andreas Bender 21 0 0 11 Jun 2025
AI5GTest: AI-Driven Specification-Aware Automated Testing and Validation of 5G O-RAN Components Abiodun Ganiyu Pranshav Gajjar Vijay K. Shah 53 0 0 11 Jun 2025
Measuring Corporate Human Capital Disclosures: Lexicon, Data, Code, and Research Opportunities Elizabeth Demers Victor Xiaoqi Wang Kean Wu 55 0 0 11 Jun 2025
HSENet: Hybrid Spatial Encoding Network for 3D Medical Vision-Language Understanding Yanzhao Shi Xiaodan Zhang Junzhong Ji Haoning Jiang Chengxin Zheng Y. Wang Liangqiong Qu 91 0 0 11 Jun 2025
Vision Generalist Model: A Survey Ziyi Wang Yongming Rao Shuofeng Sun Xinrun Liu Yi Wei ... Zuyan Liu Yanbo Wang Hongmin Liu Jie Zhou Jiwen Lu 72 0 0 11 Jun 2025
Memorization in Language Models through the Lens of Intrinsic Dimension Stefan Arnold PILM 113 0 0 11 Jun 2025
CAF-I: A Collaborative Multi-Agent Framework for Enhanced Irony Detection with Large Language Models Ziqi.Liu Ziyang.Zhou Mingxuan.Hu 24 0 0 10 Jun 2025
Enhancing Video Memorability Prediction with Text-Motion Cross-modal Contrastive Loss and Its Application in Video Summarization Zhiyi Zhu Xiaoyu Wu Youwei Lu 35 0 0 10 Jun 2025
Superposed Parameterised Quantum Circuits Viktoria Patapovich Mo Kordzanganeh A. Melnikov 41 0 0 10 Jun 2025
Merging Smarter, Generalizing Better: Enhancing Model Merging on OOD Data Bingjie Zhang Hongkang Li Changlong Shi Guowei Rong He Zhao Dongsheng Wang Dandan Guo Meng Wang MoMe 58 0 0 10 Jun 2025
On Reasoning Strength Planning in Large Reasoning Models Leheng Sheng An Zhang Zijian Wu Weixiang Zhao Changshuo Shen Yi Zhang Xiang Wang Tat-Seng Chua LRM 27 0 0 10 Jun 2025
Fairness is Not Silence: Unmasking Vacuous Neutrality in Small Language Models Sumanth Manduru Carlotta Domeniconi ALM 20 0 0 10 Jun 2025
Data Augmentation For Small Object using Fast AutoAugment DaeEun Yoon Semin Kim SangWook Yoo Jongha Lee 12 0 0 10 Jun 2025
Know-MRI: A Knowledge Mechanisms Revealer&Interpreter for Large Language Models Jiaxiang Liu Boxuan Xing Chenhao Yuan Chenxiang Zhang Di Wu ... Haida Yu Chuhan Lang Pengfei Cao Jun Zhao Kang Liu 25 0 0 10 Jun 2025
Integration of Old and New Knowledge for Generalized Intent Discovery: A Consistency-driven Prototype-Prompting Framework Xiao Wei Xiaobao Wang Ning Zhuang Chenyang Wang L. Wang Jianwu Dang 21 0 0 10 Jun 2025
Enhanced Whole Page Optimization via Mixed-Grained Reward Mechanism-Adapted Language Models Xinyuan Wang Liang Wu Yanjie Fu 32 0 0 10 Jun 2025
Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis Jingguo Qu Xinyang Han Tonghuan Xiao Jia Ai Juan Wu ... Jing Qin Ann Dorothy King Winnie Chiu-Wing Chu J. Cai Michael Tin-Cheung Ying MedIm 55 0 0 10 Jun 2025