v1v2v3 (latest)

Neural Network Acceptability Judgments

31 May 2018

Alex Warstadt

Amanpreet Singh

Samuel R. Bowman

ArXiv (abs)PDF HTML

Papers citing "Neural Network Acceptability Judgments"

50 / 894 papers shown

Title
CAMEx: Curvature-aware Merging of Experts Dung V. Nguyen Minh H. Nguyen Luc Q. Nguyen R. Teo T. Nguyen Linh Duy Tran MoMe 174 4 0 26 Feb 2025
Tokenization is Sensitive to Language Variation Anna Wegmann Dong Nguyen David Jurgens 148 2 0 24 Feb 2025
Encryption-Friendly LLM Architecture Donghwan Rho Taeseong Kim Minje Park Jung Woo Kim Hyunsik Chae Jung Hee Cheon Ernest K. Ryu 230 6 0 24 Feb 2025
Using tournaments to calculate AUROC for zero-shot classification with LLMs WonJin Yoon Ian Bulovic Timothy A. Miller 84 1 0 24 Feb 2025
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment Chenghao Fan Zhenyi Lu Sichen Liu Xiaoye Qu Xiaoye Qu Wei Wei Yu Cheng MoE 517 1 0 24 Feb 2025
Are Sparse Autoencoders Useful? A Case Study in Sparse Probing Subhash Kantamneni Joshua Engels Senthooran Rajamanoharan Max Tegmark Neel Nanda 141 17 0 23 Feb 2025
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation Yue Zhou Yi-Ju Chang Yuan Wu MoMe 122 3 0 21 Feb 2025
Scalable Model Merging with Progressive Layer-wise Distillation Jing Xu Jiazheng Li J.N. Zhang MoMe FedML 325 2 0 18 Feb 2025
An Efficient Row-Based Sparse Fine-Tuning Cen-Jhih Li Aditya Bhaskara 115 0 0 17 Feb 2025
Reinforced Lifelong Editing for Language Models Zherui Li Houcheng Jiang Hao Chen Baolong Bi Zhenhong Zhou Fei Sun Sihang Li Xinze Wang KELM 153 8 0 09 Feb 2025
CE-LoRA: Computation-Efficient LoRA Fine-Tuning for Language Models Guanduo Chen Yutong He Yipeng Hu Kun Yuan Binhang Yuan 111 1 0 03 Feb 2025
Understanding Why Adam Outperforms SGD: Gradient Heterogeneity in Transformers Akiyoshi Tomihari Issei Sato ODL 153 3 0 31 Jan 2025
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models Yibin Wang Haizhou Shi Ligong Han Dimitris N. Metaxas Hao Wang BDL UQLM 226 13 0 28 Jan 2025
Reference-free Evaluation Metrics for Text Generation: A Survey Takumi Ito Kees van Deemter Jun Suzuki ELM 123 2 0 21 Jan 2025
A General Framework for Inference-time Scaling and Steering of Diffusion Models R. Singhal Zachary Horvitz Ryan Teehan Mengye Ren Zhou Yu Kathleen McKeown Rajesh Ranganath DiffM 145 31 0 17 Jan 2025
Breaking Memory Limits: Gradient Wavelet Transform Enhances LLMs Training Ziqing Wen Ping Luo Jun Wang Xiaoge Deng Jinping Zou Kun Yuan Tao Sun Dongsheng Li CLL 43 0 0 13 Jan 2025
GPT or BERT: why not both? Lucas Georges Gabriel Charpentier David Samuel 156 5 0 31 Dec 2024
Learning from Impairment: Leveraging Insights from Clinical Linguistics in Language Modelling Research Dominique Brunato 116 1 0 20 Dec 2024
Weak-to-Strong Generalization Through the Data-Centric Lens Changho Shin John Cooper Frederic Sala 190 9 0 05 Dec 2024
Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning Kaustubh Ponkshe Raghav Singhal Eduard A. Gorbunov Alexey Tumanov Samuel Horváth Praneeth Vepakomma 271 7 0 29 Nov 2024
LoRA-Mini : Adaptation Matrices Decomposition and Selective Training Ayush Singh Rajdeep Aher Shivank Garg 129 1 0 24 Nov 2024
Mitigating Gender Bias in Contextual Word Embeddings Navya Yarrabelly Vinay Damodaran Feng-Guang Su 82 0 0 18 Nov 2024
Model Fusion through Bayesian Optimization in Language Model Fine-Tuning Chaeyun Jang Hyungi Lee Jungtaek Kim Juho Lee MoMe 136 4 0 11 Nov 2024
Robust and Efficient Fine-tuning of LLMs with Bayesian Reparameterization of Low-Rank Adaptation Ayan Sengupta Vaibhav Seth Arinjay Pathak Natraj Raman Sriram Gopalakrishnan Tanmoy Chakraborty BDL 53 2 0 07 Nov 2024
Scalable Efficient Training of Large Language Models with Low-dimensional Projected Attention Xingtai Lv Ning Ding Kaiyan Zhang Ermo Hua Ganqu Cui Bowen Zhou 60 3 0 04 Nov 2024
Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment Chengting Yu Fengzhao Zhang Ruizhe Chen Zuozhu Liu Shurun Tan Er-ping Li Aili Wang 84 2 0 03 Nov 2024
Magnitude Pruning of Large Pretrained Transformer Models with a Mixture Gaussian Prior Mingxuan Zhang Y. Sun F. Liang 108 0 0 01 Nov 2024
Improving In-Context Learning with Small Language Model Ensembles M. Mehdi Mojarradi Lingyi Yang Robert McCraith Adam Mahdi 54 1 0 29 Oct 2024
Learning from Response not Preference: A Stackelberg Approach for LLM Detoxification using Non-parallel Data Xinhong Xie Tao Li Quanyan Zhu 50 3 0 27 Oct 2024
Vulnerability of LLMs to Vertically Aligned Text Manipulations Zhecheng Li Yijiao Wang Bryan Hooi Yujun Cai Zhen Xiong Nanyun Peng Kai-Wei Chang 139 1 0 26 Oct 2024
Natural GaLore: Accelerating GaLore for memory-efficient LLM Training and Fine-tuning Arijit Das 31 2 0 21 Oct 2024
Implicit Regularization of Sharpness-Aware Minimization for Scale-Invariant Problems Bingcong Li Liang Zhang Niao He 93 8 0 18 Oct 2024
From Babbling to Fluency: Evaluating the Evolution of Language Models in Terms of Human Language Acquisition Qiyuan Yang Pengda Wang Luke D. Plonsky Frederick L. Oswald Hanjie Chen ELM 77 2 0 17 Oct 2024
Balancing Label Quantity and Quality for Scalable Elicitation Alex Troy Mallen Nora Belrose 68 2 0 17 Oct 2024
Identifying Task Groupings for Multi-Task Learning Using Pointwise V-Usable Information Yingya Li Timothy A. Miller Steven Bethard G. Savova 75 2 0 16 Oct 2024
StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples Ajay Patel Jiacheng Zhu Justin Qiu Zachary Horvitz Marianna Apidianaki Kathleen McKeown Chris Callison-Burch 160 4 0 16 Oct 2024
LoKO: Low-Rank Kalman Optimizer for Online Fine-Tuning of Large Models Hossein Abdi Mingfei Sun Andi Zhang Samuel Kaski Wei Pan 68 0 0 15 Oct 2024
BiDoRA: Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation Peijia Qin Ruiyi Zhang Pengtao Xie 60 2 0 13 Oct 2024
Text Classification using Graph Convolutional Networks: A Comprehensive Survey Syed Mustafa Haider Rizvi Ramsha Imran Arif Mahmood GNN OOD FaML 46 2 0 12 Oct 2024
DARE the Extreme: Revisiting Delta-Parameter Pruning For Fine-Tuned Models Wenlong Deng Yize Zhao V. Vakilian Minghui Chen Xiaoxiao Li Christos Thrampoulidis 216 7 0 12 Oct 2024
Parameter-Efficient Fine-Tuning of Large Language Models using Semantic Knowledge Tuning Nusrat Jahan Prottasha Asif Mahmud Md. Shohanur Islam Sobuj Prakash Bhat Md. Kowsher Niloofar Yousefi O. Garibay 108 7 0 11 Oct 2024
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning Yu-Chen Lin Wei-Hua Li Jun-Cheng Chen Chu-Song Chen 51 1 0 10 Oct 2024
Noise is All You Need: Private Second-Order Convergence of Noisy SGD Dmitrii Avdiukhin Michael Dinitz Chenglin Fan G. Yaroslavtsev 69 1 0 09 Oct 2024
HyperINF: Unleashing the HyperPower of the Schulz's Method for Data Influence Estimation Xinyu Zhou Simin Fan Martin Jaggi TDI 87 1 0 07 Oct 2024
Neuron-Level Sequential Editing for Large Language Models Houcheng Jiang Sihang Li Tianyu Zhang An Zhang Ruipeng Wang Tao Liang Xiang Wang KELM 108 4 0 05 Oct 2024
Parameter Competition Balancing for Model Merging Guodong DU Junlin Lee Jing Li Runhua Jiang Yifei Guo ... Hanting Liu Sim Kuan Goh Jing Li Daojing He Min Zhang MoMe 95 24 0 03 Oct 2024
AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models Sihang Li Houcheng Jiang Kun Wang Yunshan Ma Shi Jie Xiangnan He Tat-Seng Chua Tat-seng Chua KELM 204 66 0 03 Oct 2024
Fisher Information-based Efficient Curriculum Federated Learning with Large Language Models Ji Liu Jiaxiang Ren Ruoming Jin Zijie Zhang Yang Zhou P. Valduriez Dejing Dou FedML 91 6 0 30 Sep 2024
Analysing Zero-Shot Readability-Controlled Sentence Simplification Abdullah Barayan Jose Camacho-Collados Fernando Alva-Manchego 83 3 0 30 Sep 2024
Exposing Assumptions in AI Benchmarks through Cognitive Modelling Jonathan H. Rystrøm Kenneth C. Enevoldsen 63 0 0 25 Sep 2024