BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

11 October 2018

Papers citing "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

50 / 1,211 papers shown

Title
MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder Khai-Nguyen Nguyen Phuc Phan Tan-Hanh Pham Bach Phan Tat Minh-Huong Ngo Chris Ngo Thanh Nguyen-Tang Truong-Son Hy LM&MA 70 0 0 21 Sep 2024
PointSAM: Pointly-Supervised Segment Anything Model for Remote Sensing Images Nanqing Liu Xun Xu Yongyi Su Haojie Zhang Heng-Chao Li VLM 68 14 0 20 Sep 2024
Towards LifeSpan Cognitive Systems Yu Wang Chi Han Tongtong Wu Xiaoxin He Wangchunshu Zhou ... Zexue He Wei Wang Gholamreza Haffari Heng Ji Julian McAuley KELM CLL 386 2 0 20 Sep 2024
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition Stephen Zhang Vardan Papyan VLM 110 3 0 20 Sep 2024
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination Eva Sánchez Salido Roser Morante Julio Gonzalo Guillermo Marco Jorge Carrillo-de-Albornoz ... Enrique Amigó Andrés Fernández Alejandro Benito-Santos Adrián Ghajari Espinosa Victor Fresno ELM 73 0 0 19 Sep 2024
End-to-end Open-vocabulary Video Visual Relationship Detection using Multi-modal Prompting Yongqi Wang Xinxiao Wu Shuo Yang Jiebo Luo 369 1 0 19 Sep 2024
Monomial Matrix Group Equivariant Neural Functional Networks Hoang V. Tran Thieu N. Vo Tho H. Tran An T. Nguyen Tan M. Nguyen 81 5 0 18 Sep 2024
DocMamba: Efficient Document Pre-training with State Space Model Pengfei Hu Zhenrong Zhang Jiefeng Ma Shuhang Liu Jun Du Jianshu Zhang Mamba 56 1 0 18 Sep 2024
WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild Rolandos Alexandros Potamias Jinglei Zhang Jiankang Deng Stefanos Zafeiriou 3DH 64 12 0 18 Sep 2024
Prompt Obfuscation for Large Language Models David Pape Thorsten Eisenhofer Thorsten Eisenhofer Lea Schönherr AAML 87 4 0 17 Sep 2024
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework Jiahao Yuan Zixiang Di Zhiqing Cui Guisong Yang Usman Naseem 102 0 0 16 Sep 2024
Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning Amin Karimi Monsefi Mengxi Zhou Nastaran Karimi Monsefi Ser-Nam Lim Wei-Lun Chao R. Ramnath 90 1 0 16 Sep 2024
Leveraging Open-Source Large Language Models for Native Language Identification Yee Man Ng Ilia Markov 61 2 0 15 Sep 2024
Towards understanding evolution of science through language model series Junjie Dong Zhuoqi Lyu Qing Ke AI4TS 105 0 0 15 Sep 2024
What to align in multimodal contrastive learning? Benoit Dufumier J. Castillo-Navarro D. Tuia Jean-Philippe Thiran 70 4 0 11 Sep 2024
What is the Role of Small Models in the LLM Era: A Survey Lihu Chen Gaël Varoquaux ALM 142 26 0 10 Sep 2024
PingPong: A Benchmark for Role-Playing Language Models with User Emulation and Multi-Model Evaluation Ilya Gusev LLMAG 73 3 0 10 Sep 2024
Ethereum Fraud Detection via Joint Transaction Language Model and Graph Representation Learning Yifan Jia Yanbin Wang Jianguo Sun Yiwei Liu Zhang Sheng Ye Tian 122 4 0 09 Sep 2024
Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering Jan Hofmann Cornelia Sindermann Roman Klinger 74 0 0 06 Sep 2024
Open-MAGVIT2: An Open-Source Project Toward Democratizing Auto-regressive Visual Generation Zhuoyan Luo Fengyuan Shi Yixiao Ge Yujiu Yang Limin Wang Ying Shan VLM 92 54 0 06 Sep 2024
iConFormer: Dynamic Parameter-Efficient Tuning with Input-Conditioned Adaptation Hayeon Jo Hyesong Choi Minhee Cho Dongbo Min 73 1 0 04 Sep 2024
LUK: Empowering Log Understanding with Expert Knowledge from Large Language Models Lipeng Ma Weidong Yang Sihang Jiang Ben Fei Mingjie Zhou Shuhao Li Bo Xu Bo Xu Yanghua Xiao 94 0 0 03 Sep 2024
Differentially Private Kernel Density Estimation Erzhi Liu Jerry Yao-Chieh Hu Alex Reneau Zhao Song Han Liu 84 3 0 03 Sep 2024
Masked Mixers for Language Generation and Retrieval Benjamin L. Badger 94 0 0 02 Sep 2024
CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models Jonathan Bourne 77 4 0 30 Aug 2024
Joint Estimation and Prediction of City-wide Delivery Demand: A Large Language Model Empowered Graph-based Learning Approach Tong Nie Junlin He Yuewen Mei Guoyang Qin Guilong Li Jian Sun Wei Ma 62 4 0 30 Aug 2024
Medical Report Generation Is A Multi-label Classification Problem Yijian Fan Zhenbang Yang Rui Liu Mingjie Li Xiaojun Chang MedIm 71 1 0 30 Aug 2024
NanoMVG: USV-Centric Low-Power Multi-Task Visual Grounding based on Prompt-Guided Camera and 4D mmWave Radar Runwei Guan Jianan Liu Liye Jia Haocheng Zhao Shanliang Yao Xiaohui Zhu Ka Lok Man Eng Gee Lim Jeremy S. Smith Yutao Yue 100 5 0 30 Aug 2024
A Survey of the Self Supervised Learning Mechanisms for Vision Transformers Asifullah Khan A. Sohail Mustansar Fiaz Mehdi Hassan Tariq Habib Afridi ... Muhammad Zaigham Zaheer Kamran Ali Tangina Sultana Ziaurrehman Tanoli Naeem Akhter 142 4 0 30 Aug 2024
Audio xLSTMs: Learning Self-Supervised Audio Representations with xLSTMs Sarthak Yadav Sergios Theodoridis Zheng-Hua Tan 68 3 0 29 Aug 2024
HyPA-RAG: A Hybrid Parameter Adaptive Retrieval-Augmented Generation System for AI Legal and Policy Applications Rishi Kalra Zekun Wu Ayesha Gulley Airlie Hilliard Xin Guan Adriano Soares Koshiyama Philip C. Treleaven RALM AILaw 82 5 0 29 Aug 2024
An Investigation of Warning Erroneous Chat Translations in Cross-lingual Communication Yunmeng Li Jun Suzuki Makoto Morishita Kaori Abe Kentaro Inui 92 1 0 28 Aug 2024
Using Large Language Models to Create AI Personas for Replication, Generalization and Prediction of Media Effects: An Empirical Test of 133 Published Experimental Research Findings Leo Yeykelis Kaavya Pichai James J. Cummings Byron Reeves 80 2 0 28 Aug 2024
Certified Causal Defense with Generalizable Robustness Yiran Qiao Yu Yin Chen Chen Jing Ma AAML OOD CML 118 0 0 28 Aug 2024
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction Elisabeth Fischer Albin Zehe Andreas Hotho Daniel Schlor HAI 86 0 0 28 Aug 2024
The Benefits of Balance: From Information Projections to Variance Reduction Lang Liu Ronak R. Mehta Soumik Pal Zaïd Harchaoui 45 0 0 27 Aug 2024
Can Transformers Do Enumerative Geometry? Baran Hashemi Roderic G. Corominas Alessandro Giacchetto 265 3 0 27 Aug 2024
Can Optimization Trajectories Explain Multi-Task Transfer? David Mueller Mark Dredze Nicholas Andrews 104 1 0 26 Aug 2024
An Embedding is Worth a Thousand Noisy Labels Francesco Di Salvo Sebastian Doerrich Ines Rieger Christian Ledig NoLa 92 0 0 26 Aug 2024
IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities Bin Wang Chunyu Xie Dawei Leng Yuhui Yin MLLM 91 1 0 23 Aug 2024
Dynamics of Meta-learning Representation in the Teacher-student Scenario Hui Wang Cho Tung Yip Bo Li 73 0 0 22 Aug 2024
RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data Chenglong Wang Yang Gan Yifu Huo Yongyu Mu Murun Yang ... Chunliang Zhang Tongran Liu Quan Du Di Yang Jingbo Zhu VLM 83 4 0 22 Aug 2024
Cell-ontology guided transcriptome foundation model Xinyu Yuan Zhihao Zhan Zuobai Zhang Manqi Zhou Jianan Zhao Boyu Han Yue Li Jian Tang 73 1 0 22 Aug 2024
CLEANANERCorp: Identifying and Correcting Incorrect Labels in the ANERcorp Dataset Mashael Al-Duwais H. Al-Khalifa Abdulmalik Al-Salman 89 0 0 22 Aug 2024
The Russian-focused embedders' exploration: ruMTEB benchmark and Russian embedding model design Artem Snegirev Maria Tikhonova Anna Maksimova Alena Fenogenova Alexander Abramov 124 6 0 22 Aug 2024
CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction Rong Han Xiaohong Liu Tong Pan Jing Xu Xiaoyu Wang ... Zhenyu Li Zixuan Wang Jiangning Song Guangyu Wang Ting Chen 62 1 0 21 Aug 2024
Customizing Language Models with Instance-wise LoRA for Sequential Recommendation Xiaoyu Kong Jiancan Wu An Zhang Leheng Sheng Hui Lin Xiang Wang Xiangnan He AI4TS 83 10 0 19 Aug 2024
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation Yuyang Ye Zhi Zheng Yishan Shen Tianshu Wang Hengruo Zhang Peijun Zhu Runlong Yu Kai Zhang Hui Xiong 64 10 0 19 Aug 2024
DiffZOO: A Purely Query-Based Black-Box Attack for Red-teaming Text-to-Image Generative Model via Zeroth Order Optimization Pucheng Dang Xing Hu Dong Li Rui Zhang Qi Guo Kaidi Xu DiffM 70 5 0 18 Aug 2024
Threshold Filtering Packing for Supervised Fine-Tuning: Training Related Samples within Packs Jiancheng Dong Lei Jiang Wei Jin Lu Cheng 64 1 0 18 Aug 2024