BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

11 October 2018

Papers citing "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

50 / 1,211 papers shown

Title
PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches Rana Muhammad Shahroz Khan Pingzhi Li Sukwon Yun Zhenyu Wang S. Nirjon Chau-Wai Wong Tianlong Chen KELM 83 2 0 08 Oct 2024
Compositional Risk Minimization Divyat Mahajan Mohammad Pezeshki Ioannis Mitliagkas Kartik Ahuja Pascal Vincent Pascal Vincent 49 4 0 08 Oct 2024
DEPT: Decoupled Embeddings for Pre-training Language Models Alex Iacob Lorenzo Sani Meghdad Kurmanji William F. Shen Xinchi Qiu Dongqi Cai Yan Gao Nicholas D. Lane VLM 428 1 0 07 Oct 2024
Post-hoc Study of Climate Microtargeting on Social Media Ads with LLMs: Thematic Insights and Fairness Evaluation Tunazzina Islam Dan Goldwasser 98 1 0 07 Oct 2024
Leverage Knowledge Graph and Large Language Model for Law Article Recommendation: A Case Study of Chinese Criminal Law Yongming Chen Miner Chen Ye Zhu Juan Pei Siyu Chen Yu Zhou Yi Wang Yifan Zhou Hao Li Songan Zhang AILaw ELM 90 1 0 07 Oct 2024
Where are we in audio deepfake detection? A systematic analysis over generative and detection models Xiang Li Pin-Yu Chen Wenqi Wei 64 2 0 06 Oct 2024
AI as Humanity's Salieri: Quantifying Linguistic Creativity of Language Models via Systematic Attribution of Machine Text against Web Text Ximing Lu Melanie Sclar Skyler Hallinan Niloofar Mireshghallah Jiacheng Liu ... Allyson Ettinger Liwei Jiang Khyathi Chandu Nouha Dziri Yejin Choi DeLMO 72 14 0 05 Oct 2024
LoRTA: Low Rank Tensor Adaptation of Large Language Models Ignacio Hounie Charilaos I. Kanatsoulis Arnuv Tandon Alejandro Ribeiro 99 0 0 05 Oct 2024
Fundamental Limitations on Subquadratic Alternatives to Transformers Josh Alman Hantao Yu 51 2 0 05 Oct 2024
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 75 2 0 04 Oct 2024
Geometric Representation Condition Improves Equivariant Molecule Generation Zian Li Cai Zhou Xiyuan Wang Xingang Peng Muhan Zhang 55 2 0 04 Oct 2024
Structure-Enhanced Protein Instruction Tuning: Towards General-Purpose Protein Understanding with LLMs Wei Wu Chao Wang L. Chen Mingze Yin Yiheng Zhu Kun Fu Jieping Ye Hui Xiong Zheng Wang 55 1 0 04 Oct 2024
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation Han He Qianchu Liu Lei Xu Chaitanya P. Shivade Yi Zhang S. Srinivasan Katrin Kirchhoff 50 1 0 03 Oct 2024
Agent-Oriented Planning in Multi-Agent Systems Ao Li Yuexiang Xie Songze Li Fugee Tsung Bolin Ding Yaliang Li AIFin 299 7 0 03 Oct 2024
A Survey on Point-of-Interest Recommendation: Models, Architectures, and Security Qianru Zhang Peng Yang Junliang Yu Haixin Wang Xingwei He Siu-Ming Yiu Hongzhi Yin 66 2 0 03 Oct 2024
FAN: Fourier Analysis Networks Yihong Dong Ge Li Yongding Tao Xue Jiang Kechi Zhang Jia Li Jing Su Jing Su Jun Zhang Jingjing Xu AI4TS 71 5 0 03 Oct 2024
GraphIC: A Graph-Based In-Context Example Retrieval Model for Multi-Step Reasoning Jiale Fu Yaqing Wang Simeng Han Jiaming Fan Chen Si 75 1 0 03 Oct 2024
Fair Class-Incremental Learning using Sample Weighting Jaeyoung Park Minsu Kim Steven Euijong Whang 61 0 0 02 Oct 2024
LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models Zhenyue Qin Yu Yin Dylan Campbell Xuansheng Wu Ke Zou Yih-Chung Tham Ninghao Liu Xiuzhen Zhang Qingyu Chen 63 1 0 02 Oct 2024
PhyMPGN: Physics-encoded Message Passing Graph Network for spatiotemporal PDE systems Bocheng Zeng Qi Wang Ming Yan Yang Liu Ruizhi Chengze Yi Zhang Hongsheng Liu Zidong Wang Hao Sun AI4CE 116 3 0 02 Oct 2024
Text2PDE: Latent Diffusion Models for Accessible Physics Simulation Anthony Zhou Zijie Li Michael Schneier John R Buchanan Jr Amir Barati Farimani AI4CE DiffM 99 6 0 02 Oct 2024
Transformers Handle Endogeneity in In-Context Linear Regression Haodong Liang Krishnakumar Balasubramanian Lifeng Lai 71 1 0 02 Oct 2024
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models Seanie Lee Haebin Seong Dong Bok Lee Minki Kang Xiaoyin Chen Dominik Wagner Yoshua Bengio Juho Lee Sung Ju Hwang 97 5 0 02 Oct 2024
FlashMask: Efficient and Rich Mask Extension of FlashAttention Guoxia Wang Jinle Zeng Xiyuan Xiao Siming Wu Jiabin Yang Lujing Zheng Zeyu Chen Jiang Bian Dianhai Yu Haifeng Wang 283 2 0 02 Oct 2024
Attention layers provably solve single-location regression Pierre Marion Raphael Berthier Gérard Biau Claire Boyer 346 4 0 02 Oct 2024
Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models Lucas Bandarkar Benjamin Muller Pritish Yuvraj Rui Hou Nayan Singhal Hongjiang Lv Bing-Quan Liu KELM LRM MoMe 72 4 0 02 Oct 2024
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning Jiaqing Xie Yue Zhao 73 0 0 02 Oct 2024
Differentially Private Active Learning: Balancing Effective Data Selection and Privacy Kristian Schwethelm Johannes Kaiser Jonas Kuntzer Mehmet Yigitsoy Daniel Rueckert Georgios Kaissis 72 0 0 01 Oct 2024
Recent Advances in Speech Language Models: A Survey Wenqian Cui Dianzhi Yu Xiaoqi Jiao Ziqiao Meng Guangyan Zhang Qichao Wang Yiwen Guo Irwin King AuLLM 89 22 0 01 Oct 2024
Advancing Medical Radiograph Representation Learning: A Hybrid Pre-training Paradigm with Multilevel Semantic Granularity Hanqi Jiang Xixuan Hao Yuzhou Huang Chong Ma Jiaxun Zhang Yi Pan Ruimao Zhang MedIm 122 0 0 01 Oct 2024
What Information Contributes to Log-based Anomaly Detection? Insights from a Configurable Transformer-Based Approach Xingfang Wu Heng Li Foutse Khomh AI4TS 62 0 0 30 Sep 2024
Task-Adaptive Pretrained Language Models via Clustered-Importance Sampling David Grangier Simin Fan Skyler Seto Pierre Ablin 98 4 0 30 Sep 2024
QAEncoder: Towards Aligned Representation Learning in Question Answering System Zhengren Wang Qinhan Yu Shida Wei Zhiyu Li Feiyu Xiong Xiaoxing Wang Pengnian Qi Hao Liang Wentao Zhang RALM 90 1 0 30 Sep 2024
Identifying Knowledge Editing Types in Large Language Models Xiaopeng Li Shasha Li Shangwen Wang Shezheng Song Bin Ji Huijun Liu Jun Ma Jie Yu KELM 45 1 0 29 Sep 2024
Confidential Prompting: Protecting User Prompts from Cloud LLM Providers In Gim Caihua Li Lin Zhong 72 3 0 27 Sep 2024
Do We Need Domain-Specific Embedding Models? An Empirical Investigation Yixuan Tang Yi Yang AIFin 104 4 0 27 Sep 2024
Meta-RTL: Reinforcement-Based Meta-Transfer Learning for Low-Resource Commonsense Reasoning Yu Fu Jie He Yifan Yang Qun Liu Deyi Xiong OffRL LRM 62 0 0 27 Sep 2024
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task Xindi Tong Yujin Zhu Shijian Fan Liang Xu 79 1 0 26 Sep 2024
Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography Yuexi Du John Onofrey Nicha Dvornek VLM 75 1 0 26 Sep 2024
EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models Shaoxiong Ji Zihao Li Indraneil Paul Jaakko Paavola Peiqin Lin ... Dayyán O'Brien Hengyu Luo Hinrich Schütze Jörg Tiedemann Barry Haddow CLL 70 7 0 26 Sep 2024
LangSAMP: Language-Script Aware Multilingual Pretraining Yihong Liu Haotian Ye Chunlan Ma Mingyang Wang Hinrich Schütze VLM 108 0 0 26 Sep 2024
Comparing Unidirectional, Bidirectional, and Word2vec Models for Discovering Vulnerabilities in Compiled Lifted Code Gary A. McCully John D. Hastings Shengjie Xu Adam Fortier 65 2 0 26 Sep 2024
Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data Lukas Heine Fabian Horst Jana Fragemann Gijs Luijten M. Balzer Jan Egger F. Bahnsen M. Sarfraz Jens Kleesiek 56 0 0 25 Sep 2024
E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL Hasan Alp Caferoğlu Özgür Ulusoy 68 20 0 25 Sep 2024
iGAiVA: Integrated Generative AI and Visual Analytics in a Machine Learning Workflow for Text Classification Yuanzhe Jin Adrian Carrasco-Revilla Min Chen VLM 69 1 0 24 Sep 2024
PROMPTFUZZ: Harnessing Fuzzing Techniques for Robust Testing of Prompt Injection in LLMs Jiahao Yu Yangguang Shao Hanwen Miao Junzheng Shi SILM AAML 114 7 0 23 Sep 2024
ToxiCraft: A Novel Framework for Synthetic Generation of Harmful Information Zheng Hui Zhaoxiao Guo Hang Zhao Juanyong Duan Congrui Huang 72 7 0 23 Sep 2024
Rethinking Semantic Parsing for Large Language Models: Enhancing LLM Performance with Semantic Hints Kaikai An Shuzheng Si Helan Hu Haozhe Zhao Yuchi Wang Qingyan Guo Baobao Chang LRM ReLM 86 2 0 22 Sep 2024
Scene-Text Grounding for Text-Based Video Question Answering Sheng Zhou Junbin Xiao Xun Yang Peipei Song Dan Guo Angela Yao Meng Wang Tat-Seng Chua 190 1 0 22 Sep 2024
Uncovering Latent Chain of Thought Vectors in Language Models Jason Zhang Scott Viteri LLMSV LRM 72 3 0 21 Sep 2024