Revisiting Few-sample BERT Fine-tuning

10 June 2020

Papers citing "Revisiting Few-sample BERT Fine-tuning"

50 / 91 papers shown

Title
Fine-Tuning without Performance Degradation Han Wang Adam White Martha White OnRL 161 0 0 01 May 2025
Memorization and Knowledge Injection in Gated LLMs Xu Pan Ely Hahami Zechen Zhang H. Sompolinsky KELM CLL RALM 104 1 0 30 Apr 2025
Fine-Tuning Games: Bargaining and Adaptation for General-Purpose Models Benjamin Laufer Jon M. Kleinberg Hoda Heidari 55 8 0 03 Jan 2025
Modality Translation for Object Detection Adaptation Without Forgetting Prior Knowledge H. R. Medeiros Masih Aminbeidokhti F. Guerrero-Peña David Latortue Eric Granger M. Pedersoli VLM 45 2 0 01 Apr 2024
Token-Efficient Leverage Learning in Large Language Models Yuanhao Zeng Min Wang Yihang Wang Yingxia Shao 34 0 0 01 Apr 2024
From Text to Transformation: A Comprehensive Review of Large Language Models' Versatility Pravneet Kaur Gautam Siddharth Kashyap Ankit Kumar Md. Tabrez Nafis Sandeep Kumar Vikrant Shokeen LM&MA 48 54 0 25 Feb 2024
CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion Zijun Long George Killick Lipeng Zhuang Gerardo Aragon Camarasa Zaiqiao Meng R. McCreadie VLM 50 2 0 22 Feb 2024
NoisyICL: A Little Noise in Model Parameters Calibrates In-context Learning Yufeng Zhao Yoshihiro Sakai Naoya Inoue 33 3 0 08 Feb 2024
Language of Bargaining Mourad Heddaya Solomon Dworkin Chenhao Tan Rob Voigt Alexander Zentefis 20 2 0 12 Jun 2023
Text-To-KG Alignment: Comparing Current Methods on Classification Tasks Sondre Wold Lilja Ovrelid Erik Velldal 22 3 0 05 Jun 2023
Prompt to be Consistent is Better than Self-Consistent? Few-Shot and Zero-Shot Fact Verification with Pre-trained Language Models Fengzhu Zeng Wei Gao 17 5 0 05 Jun 2023
Bi-Drop: Enhancing Fine-tuning Generalization via Synchronous sub-net Estimation and Optimization Shoujie Tong Heming Xia Damai Dai Runxin Xu Tianyu Liu Binghuai Lin Yunbo Cao Zhifang Sui 20 0 0 24 May 2023
The EarlyBIRD Catches the Bug: On Exploiting Early Layers of Encoder Models for More Efficient Code Classification Anastasiia Grishina Max Hort Leon Moonen 22 6 0 08 May 2023
Team QUST at SemEval-2023 Task 3: A Comprehensive Study of Monolingual and Multilingual Approaches for Detecting Online News Genre, Framing and Persuasion Techniques Ye Jiang 22 9 0 09 Apr 2023
Mask-guided BERT for Few Shot Text Classification Wenxiong Liao Zheng Liu Haixing Dai Zihao Wu Yiyang Zhang ... Dajiang Zhu Tianming Liu Sheng Li Xiang Li Hongmin Cai VLM 47 39 0 21 Feb 2023
Measuring the Instability of Fine-Tuning Yupei Du D. Nguyen 25 4 0 15 Feb 2023
How to prepare your task head for finetuning Yi Ren Shangmin Guo Wonho Bae Danica J. Sutherland 24 14 0 11 Feb 2023
Evaluating the Robustness of Discrete Prompts Yoichi Ishibashi Danushka Bollegala Katsuhito Sudoh Satoshi Nakamura 23 18 0 11 Feb 2023
Revisiting Intermediate Layer Distillation for Compressing Language Models: An Overfitting Perspective Jongwoo Ko Seungjoon Park Minchan Jeong S. Hong Euijai Ahn Duhyeuk Chang Se-Young Yun 23 6 0 03 Feb 2023
A Stability Analysis of Fine-Tuning a Pre-Trained Model Z. Fu Anthony Man-Cho So Nigel Collier 23 3 0 24 Jan 2023
Examining Political Rhetoric with Epistemic Stance Detection Ankita Gupta Su Lin Blodgett Justin H. Gross Brendan O'Connor 22 0 0 29 Dec 2022
KL Regularized Normalization Framework for Low Resource Tasks Neeraj Kumar Ankur Narang Brejesh Lall 26 1 0 21 Dec 2022
DuNST: Dual Noisy Self Training for Semi-Supervised Controllable Text Generation Yuxi Feng Xiaoyuan Yi Xiting Wang L. Lakshmanan Xing Xie DiffM 35 5 0 16 Dec 2022
Decoder Tuning: Efficient Language Understanding as Decoding Ganqu Cui Wentao Li Ning Ding Longtao Huang Zhiyuan Liu Maosong Sun 21 6 0 16 Dec 2022
Revisiting Distance Metric Learning for Few-Shot Natural Language Classification Witold Sosnowski Anna Wróblewska Karolina Seweryn P. Gawrysiak 21 0 0 28 Nov 2022
Distance Metric Learning Loss Functions in Few-Shot Scenarios of Supervised Language Models Fine-Tuning Witold Sosnowski Karolina Seweryn Anna Wróblewska P. Gawrysiak 23 0 0 28 Nov 2022
An Efficient Active Learning Pipeline for Legal Text Classification Sepideh Mamooler R. Lebret Stéphane Massonnet Karl Aberer AILaw 24 4 0 15 Nov 2022
Eliciting Knowledge from Large Pre-Trained Models for Unsupervised Knowledge-Grounded Conversation Yanyang Li Jianqiao Zhao M. Lyu Liwei Wang 16 15 0 03 Nov 2022
Gradient Knowledge Distillation for Pre-trained Language Models Lean Wang Lei Li Xu Sun VLM 23 5 0 02 Nov 2022
AdaMix: Mixture-of-Adaptations for Parameter-efficient Model Tuning Yaqing Wang Sahaj Agarwal Subhabrata Mukherjee Xiaodong Liu Jing Gao Ahmed Hassan Awadallah Jianfeng Gao MoE 19 117 0 31 Oct 2022
STPrompt: Semantic-guided and Task-driven prompts for Effective Few-shot Classification Jinta Weng Yue Hu Jing Qiu Heyan Huan VLM 11 0 0 29 Oct 2022
ROSE: Robust Selective Fine-tuning for Pre-trained Language Models Lan Jiang Hao Zhou Yankai Lin Peng Li Jie Zhou R. Jiang AAML 37 8 0 18 Oct 2022
Deepfake Text Detection: Limitations and Opportunities Jiameng Pu Zain Sarwar Sifat Muhammad Abdullah A. Rehman Yoonjin Kim P. Bhattacharya M. Javed Bimal Viswanath AAML 19 54 0 17 Oct 2022
Exploring Effective Knowledge Transfer for Few-shot Object Detection Zhiyuan Zhao Qingjie Liu Yunhong Wang 35 9 0 05 Oct 2022
On the Impossible Safety of Large AI Models El-Mahdi El-Mhamdi Sadegh Farhadkhani R. Guerraoui Nirupam Gupta L. Hoang Rafael Pinot Sébastien Rouault John Stephan 30 31 0 30 Sep 2022
Efficient Few-Shot Learning Without Prompts Lewis Tunstall Nils Reimers Unso Eun Seo Jo Luke Bates Daniel Korat Moshe Wasserblat Oren Pereg VLM 34 182 0 22 Sep 2022
TransPolymer: a Transformer-based language model for polymer property predictions Changwen Xu Yuyang Wang A. Farimani 24 86 0 03 Sep 2022
Combating high variance in Data-Scarce Implicit Hate Speech Classification Debaditya Pal Kaustubh Chaudhari Harsh Sharma 25 1 0 29 Aug 2022
Mere Contrastive Learning for Cross-Domain Sentiment Analysis Yun Luo Fang Guo Zihan Liu Yue Zhang 31 15 0 18 Aug 2022
ELECTRA is a Zero-Shot Learner, Too Shiwen Ni Hung-Yu kao 22 9 0 17 Jul 2022
Knowledge Distillation of Transformer-based Language Models Revisited Chengqiang Lu Jianwei Zhang Yunfei Chu Zhengyu Chen Jingren Zhou Fei Wu Haiqing Chen Hongxia Yang VLM 27 10 0 29 Jun 2022
Few-Shot Natural Language Inference Generation with PDD: Prompt and Dynamic Demonstration Kaijian Li Shansan Gong Kenny Q. Zhu 21 0 0 21 May 2022
PromptDA: Label-guided Data Augmentation for Prompt-based Few-shot Learners Canyu Chen Kai Shu VLM 31 8 0 18 May 2022
A Comprehensive Survey of Few-shot Learning: Evolution, Applications, Challenges, and Opportunities Yisheng Song Ting-Yuan Wang S. Mondal J. P. Sahoo SLR 50 344 0 13 May 2022
Few-shot Mining of Naturally Occurring Inputs and Outputs Mandar Joshi Terra Blevins M. Lewis Daniel S. Weld Luke Zettlemoyer 30 1 0 09 May 2022
Embedding Hallucination for Few-Shot Language Fine-tuning Yiren Jian Chongyang Gao Soroush Vosoughi 23 4 0 03 May 2022
Super-Prompting: Utilizing Model-Independent Contextual Data to Reduce Data Annotation Required in Visual Commonsense Tasks Navid Rezaei Marek Reformat VLM 17 2 0 25 Apr 2022
Fusing finetuned models for better pretraining Leshem Choshen Elad Venezian Noam Slonim Yoav Katz FedML AI4CE MoMe 43 87 0 06 Apr 2022
PERFECT: Prompt-free and Efficient Few-shot Learning with Language Models Rabeeh Karimi Mahabadi Luke Zettlemoyer James Henderson Marzieh Saeidi Lambert Mathias Ves Stoyanov Majid Yazdani VLM 31 69 0 03 Apr 2022
A sequence-to-sequence approach for document-level relation extraction John Giorgi Gary D. Bader Bo Wang 35 52 0 03 Apr 2022