BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

11 October 2018

Papers citing "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

50 / 1,211 papers shown

Title
Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks Wataru Hashimoto Hidetaka Kamigaito Taro Watanabe 80 0 0 02 Jul 2024
Cross-Lingual Transfer Learning for Speech Translation Rao Ma Yassir Fathullah Mengjie Qian Siyuan Tang Mark Gales Kate Knill 88 3 0 01 Jul 2024
Eliminating Position Bias of Language Models: A Mechanistic Approach Ziqi Wang Hanlin Zhang Xiner Li Kuan-Hao Huang Chi Han Shuiwang Ji Sham Kakade Hao Peng Heng Ji 90 15 0 01 Jul 2024
Large Language Model Enhanced Knowledge Representation Learning: A Survey Xin Wang Zirui Chen Haofen Wang Leong Hou U Zhao Li Wenbin Guo KELM 103 3 0 01 Jul 2024
Teola: Towards End-to-End Optimization of LLM-based Applications Xin Tan Yimin Jiang Yitao Yang Hong-Yu Xu 100 5 0 29 Jun 2024
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model Yuxuan Zhang Tianheng Cheng Lianghui Zhu Lei Liu Heng Liu Longjin Ran Xiaoxin Chen Xiaoxin Chen Wenyu Liu Xinggang Wang VLM 106 27 0 28 Jun 2024
ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting Rui Pan Dylan Zhang Hanning Zhang Xingyuan Pan Minrui Xu Jipeng Zhang Renjie Pi Xiaoyu Wang Tong Zhang 84 9 0 28 Jun 2024
ColPali: Efficient Document Retrieval with Vision Language Models Manuel Faysse Hugues Sibille Tony Wu Bilel Omrani Gautier Viaud C´eline Hudelot Pierre Colombo VLM 139 23 0 27 Jun 2024
MissionGNN: Hierarchical Multimodal GNN-based Weakly Supervised Video Anomaly Recognition with Mission-Specific Knowledge Graph Generation Sanggeon Yun Ryozo Masukawa Minhyoung Na Mohsen Imani 68 8 0 27 Jun 2024
Cascading Large Language Models for Salient Event Graph Generation Xingwei Tan Yuxiang Zhou Gabriele Pergola Yulan He 73 0 0 26 Jun 2024
RouteLLM: Learning to Route LLMs with Preference Data Isaac Ong Amjad Almahairi Vincent Wu Wei-Lin Chiang Tianhao Wu Joseph E. Gonzalez M. W. Kadous Ion Stoica 85 85 0 26 Jun 2024
LABOR-LLM: Language-Based Occupational Representations with Large Language Models Tianyu Du Ayush Kanodia Herman Brunborg Keyon Vafa Susan Athey 46 3 0 25 Jun 2024
GMT: Guided Mask Transformer for Leaf Instance Segmentation Feng Chen Sotirios A. Tsaftaris M. Giuffrida 49 1 0 24 Jun 2024
PlagBench: Exploring the Duality of Large Language Models in Plagiarism Generation and Detection Jooyoung Lee Toshini Agrawal Adaku Uchendu Thai V. Le Jinghui Chen Dongwon Lee 98 1 0 24 Jun 2024
Large Vocabulary Size Improves Large Language Models Sho Takase Ryokan Ri Shun Kiyono Takuya Kato 67 4 0 24 Jun 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models Qi Liu Bo Wang Nan Wang Jiaxin Mao RALM 95 3 0 21 Jun 2024
GOAL: A Generalist Combinatorial Optimization Agent Learner Darko Drakulic Sofia Michel J. Andreoli 61 8 0 21 Jun 2024
Detecting AI-Generated Text: Factors Influencing Detectability with Current Methods Kathleen C. Fraser Hillary Dawkins S. Kiritchenko DeLMO 114 8 0 21 Jun 2024
DiPEx: Dispersing Prompt Expansion for Class-Agnostic Object Detection Jia Syuen Lim Zhuoxiao Chen Mahsa Baktashmotlagh Zhi Chen Xin Yu Zi Huang Yadan Luo VLM ObjD 109 1 0 21 Jun 2024
MM-GTUNets: Unified Multi-Modal Graph Deep Learning for Brain Disorders Prediction Luhui Cai Weiming Zeng Hongyu Chen Hua Zhang Yueyang Li Hongjie Yan Lingbin Bian Lingbin Bian Wai Ting Siok Nizhuan Wang MedIm 75 3 0 20 Jun 2024
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation Jiaming Zhou Teli Ma Kun-Yu Lin Ronghe Qiu Zifan Wang Junwei Liang 88 7 0 20 Jun 2024
Temporal Knowledge Graph Question Answering: A Survey Miao Su Zixuan Li Zhuo Chen Long Bai Xiaolong Jin Jiafeng Guo 70 4 0 20 Jun 2024
Encoder vs Decoder: Comparative Analysis of Encoder and Decoder Language Models on Multilingual NLU Tasks Dan S. Nielsen Kenneth Enevoldsen Peter Schneider-Kamp ELM 64 5 0 19 Jun 2024
Neuro-symbolic Training for Reasoning over Spatial Language Tanawan Premsri Parisa Kordjamshidi LRM NAI 60 6 0 19 Jun 2024
What Did I Do Wrong? Quantifying LLMs' Sensitivity and Consistency to Prompt Engineering Federico Errica G. Siracusano D. Sanvito Roberto Bifulco 133 25 0 18 Jun 2024
CollabStory: Multi-LLM Collaborative Story Generation and Authorship Analysis Saranya Venkatraman Nafis Irtiza Tripto Dongwon Lee 88 12 0 18 Jun 2024
A Generic Method for Fine-grained Category Discovery in Natural Language Texts Chang Tian Matthew B. Blaschko Wenpeng Yin Mingzhe Xing Yinliang Yue Marie-Francine Moens 109 2 0 18 Jun 2024
The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions Stefan Sylvius Wagner Maike Behrendt Marc Ziegele Stefan Harmeling 51 10 0 18 Jun 2024
Causal Discovery Inspired Unsupervised Domain Adaptation for Emotion-Cause Pair Extraction Yuncheng Hua Yujin Huang Shuo Huang Tao Feng Zhuang Li Chris Bain R. Bassed Gholamreza Haffari CML OOD 76 2 0 18 Jun 2024
News Without Borders: Domain Adaptation of Multilingual Sentence Embeddings for Cross-lingual News Recommendation Andreea Iana Fabian David Schmidt Goran Glavaš Heiko Paulheim 132 3 0 18 Jun 2024
Can LLMs Learn Macroeconomic Narratives from Social Media? Almog Gueta Amir Feder Zorik Gekhman Ariel Goldstein Roi Reichart 43 4 0 17 Jun 2024
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model Di Wang Meiqi Hu Yao Jin Yuchun Miao Jiaqi Yang ... Lefei Zhang Chen Wu Di Lin Dacheng Tao Liangpei Zhang 94 27 0 17 Jun 2024
TourRank: Utilizing Large Language Models for Documents Ranking with a Tournament-Inspired Strategy Yiqun Chen Qi Liu Yi Zhang Weiwei Sun Daiting Shi Jiaxin Mao Dawei Yin Jiaxin Mao Dawei Yin 84 9 0 17 Jun 2024
Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs D. Yaldiz Yavuz Faruk Bakman Baturalp Buyukates Chenyang Tao Anil Ramakrishna Dimitrios Dimitriadis Jieyu Zhao Salman Avestimehr 87 5 0 17 Jun 2024
P-TA: Using Proximal Policy Optimization to Enhance Tabular Data Augmentation via Large Language Models Shuo Yang Chenchen Yuan Yao Rong Felix Steinbauer Gjergji Kasneci 55 1 0 17 Jun 2024
Adversarial Style Augmentation via Large Language Model for Robust Fake News Detection Sungwon Park Sungwon Han Xing Xie Jae-Gil Lee Meeyoung Cha 75 1 0 17 Jun 2024
Ontology Embedding: A Survey of Methods, Applications and Resources Jiaoyan Chen Olga Mashkova Fernando Zhapa-Camacho Robert Hoehndorf Yuan He Ian Horrocks 77 6 0 16 Jun 2024
Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL Zijin Hong Zheng Yuan Qinggang Zhang Hao Chen Junnan Dong Feiran Huang Xiao Huang 103 62 0 12 Jun 2024
We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs Joseph Spracklen Raveen Wijewickrama A. H. M. N. Sakib Anindya Maiti Murtuza Jadliwala Murtuza Jadliwala 80 10 0 12 Jun 2024
Bilingual Sexism Classification: Fine-Tuned XLM-RoBERTa and GPT-3.5 Few-Shot Learning AmirMohammad Azadi Baktash Ansari Sina Zamani Sauleh Eetemadi 30 1 0 11 Jun 2024
MambaLRP: Explaining Selective State Space Sequence Models F. Jafari G. Montavon Klaus-Robert Müller Oliver Eberle Mamba 162 10 0 11 Jun 2024
Entropy-Reinforced Planning with Large Language Models for Drug Discovery Xuefeng Liu Chih-chan Tien Peng Ding Songhao Jiang Rick L. Stevens 73 5 0 11 Jun 2024
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension Khiem Le Zhichun Guo Kaiwen Dong Xiaobao Huang B. Nan Roshni G. Iyer Xiangliang Zhang Olaf Wiest Wei Wang Nitesh Chawla 60 8 0 10 Jun 2024
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL Qi Lv Xiang Deng Gongwei Chen Michael Yu Wang Liqiang Nie 104 7 0 08 Jun 2024
One Perturbation is Enough: On Generating Universal Adversarial Perturbations against Vision-Language Pre-training Models Hao Fang Jiawei Kong Wenbo Yu Bin Chen Jiawei Li Hao Wu Ke Xu Ke Xu AAML VLM 78 13 0 08 Jun 2024
PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction Eduard Poesina Adriana Valentina Costache Adrian-Gabriel Chifu Josiane Mothe Radu Tudor Ionescu VLM 100 1 0 07 Jun 2024
CorDA: Context-Oriented Decomposition Adaptation of Large Language Models for Task-Aware Parameter-Efficient Fine-tuning Yibo Yang Xiaojie Li Zhongzhu Zhou Shuaiwen Leon Song Jianlong Wu Liqiang Nie Guohao Li 65 11 0 07 Jun 2024
MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition Stefan Gerd Fritsch Cennet Oğuz Vitor Fortes Rey L. Ray Maximilian Kiefer-Emmanouilidis Paul Lukowicz HAI 65 0 0 06 Jun 2024
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data Jingyang Ou Shen Nie Kaiwen Xue Fengqi Zhu Jiacheng Sun Zhenguo Li Chongxuan Li DiffM 72 44 0 06 Jun 2024
What Matters in Hierarchical Search for Combinatorial Reasoning Problems? Michał Zawalski Gracjan Góral Michał Tyrolski Emilia Wisnios Franciszek Budrowski Marek Cygan Łukasz Kuciński Piotr Miłoś 59 0 0 05 Jun 2024