v1v2v3 (latest)

Neural Network Acceptability Judgments

31 May 2018

Alex Warstadt

Amanpreet Singh

Samuel R. Bowman

ArXiv (abs)PDF HTML

Papers citing "Neural Network Acceptability Judgments"

50 / 894 papers shown

Title
An Effective, Robust and Fairness-aware Hate Speech Detection Framework Guanyi Mou Kyumin Lee 69 2 0 25 Sep 2024
Wildlife Product Trading in Online Social Networks: A Case Study on Ivory-Related Product Sales Promotion Posts Guanyi Mou Yun Yue Kyumin Lee Ziming Zhang OnRL 38 0 0 25 Sep 2024
Unveiling Language Competence Neurons: A Psycholinguistic Approach to Model Interpretability Xufeng Duan Xinyu Zhou Bei Xiao Zhenguang G. Cai MILM 81 4 0 24 Sep 2024
HUT: A More Computation Efficient Fine-Tuning Method With Hadamard Updated Transformation Geyuan Zhang Xiaofei Zhou Chuheng Chen 38 0 0 20 Sep 2024
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models Xinyu Zhou Delong Chen Samuel Cahyawijaya Xufeng Duan Zhenguang G. Cai 67 1 0 19 Sep 2024
Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing? Josef Jon 64 0 0 15 Sep 2024
FP-VEC: Fingerprinting Large Language Models via Efficient Vector Addition Zhenhua Xu Wenpeng Xing Zhebo Wang Chang Hu Chen Jie Meng Han 59 1 0 13 Sep 2024
DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Models Maryam Akhavan Aghdam Hongpeng Jin Yanzhao Wu MoE 63 3 0 10 Sep 2024
Expanding Expressivity in Transformer Models with MöbiusAttention Anna-Maria Halacheva M. Nayyeri Steffen Staab 78 1 0 08 Sep 2024
Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models Aradhye Agarwal Suhas Kamasetty Ramesh Ayan Sengupta Tanmoy Chakraborty 68 1 0 26 Aug 2024
TReX- Reusing Vision Transformer's Attention for Efficient Xbar-based Computing Abhishek Moitra Abhiroop Bhattacharjee Youngeun Kim Priyadarshini Panda ViT 69 2 0 22 Aug 2024
Toward the Evaluation of Large Language Models Considering Score Variance across Instruction Templates Yusuke Sakai Adam Nohejl Jiangnan Hang Hidetaka Kamigaito Taro Watanabe ELM 132 5 0 22 Aug 2024
Crafting Tomorrow's Headlines: Neural News Generation and Detection in English, Turkish, Hungarian, and Persian Cem Uyuk Danica Rovó Shaghayegh Kolli Rabia Varol Georg Groh Daryna Dementieva 50 0 0 20 Aug 2024
How to Make the Most of LLMs' Grammatical Knowledge for Acceptability Judgments Yusuke Ide Yuto Nishida Miyu Oba Miyu Oba Justin Vasselli Hidetaka Kamigaito Taro Watanabe 127 0 0 19 Aug 2024
LoRA $^2$ : Multi-Scale Low-Rank Approximations for Fine-Tuning Large Language Models Jia-Chen Zhang Yu-Jie Xiong He-Xi Qiu Dong-Hai Zhu Chun-Ming Xia MoE 73 0 0 13 Aug 2024
Generalisation First, Memorisation Second? Memorisation Localisation for Natural Language Classification Tasks Verna Dankers Ivan Titov 79 5 0 09 Aug 2024
Why Are My Prompts Leaked? Unraveling Prompt Extraction Threats in Customized Large Language Models Zi Liang Haibo Hu Qingqing Ye Yaxin Xiao Haoyang Li AAML ELM SILM 144 9 0 05 Aug 2024
mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval Xin Zhang Yanzhao Zhang Dingkun Long Wen Xie Ziqi Dai ... Pengjun Xie Fei Huang Meishan Zhang Wenjie Li Min Zhang 134 107 0 29 Jul 2024
Stress-Testing Long-Context Language Models with Lifelong ICL and Task Haystack Xiaoyue Xu Qinyuan Ye Xiang Ren 127 10 0 23 Jul 2024
Reconstruct the Pruned Model without Any Retraining Pingjie Wang Ziqing Fan Shengchao Hu Zhe Chen Yanfeng Wang Yu Wang 82 2 0 18 Jul 2024
Evaluating Large Language Models with fmeval Pola Schwöbel Luca Franceschi Muhammad Bilal Zafar Keerthan Vasist Aman Malhotra Tomer Shenhar Pinal Tailor Pinar Yilmaz Michael Diamond Michele Donini LM&MA ELM 106 3 0 15 Jul 2024
SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning Haiwen Diao Bo Wan Xu Jia Yunzhi Zhuge Ying Zhang Huchuan Lu Long Chen VLM 93 4 0 10 Jul 2024
Testing learning hypotheses using neural networks by manipulating learning data Cara Su-Yi Leong Tal Linzen 66 5 0 05 Jul 2024
Efficient Training of Language Models with Compact and Consistent Next Token Distributions Ashutosh Sathe Sunita Sarawagi 62 0 0 03 Jul 2024
MLKD-BERT: Multi-level Knowledge Distillation for Pre-trained Language Models Ying Zhang Ziheng Yang Shufan Ji KELM 39 1 0 03 Jul 2024
Survey on Knowledge Distillation for Large Language Models: Methods, Evaluation, and Application Chuanpeng Yang Wang Lu Yao Zhu Yidong Wang Qian Chen Chenlong Gao Bingjie Yan Yiqiang Chen ALM KELM 101 32 0 02 Jul 2024
CPT: Consistent Proxy Tuning for Black-box Optimization Yuanyang He Zitong Huang Xinxing Xu Rick Siow Mong Goh Salman Khan W. Zuo Yong Liu Chun-Mei Feng 95 0 0 01 Jul 2024
Exploring Advanced Large Language Models with LLMsuite Giorgio Roffo LLMAG 36 0 0 01 Jul 2024
Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation Hye Ryung Son Jay-Yoon Lee 73 0 0 30 Jun 2024
IDT: Dual-Task Adversarial Attacks for Privacy Protection Pedro Faustini Shakila Mahjabin Tonni Annabelle McIver Xingliang Yuan Mark Dras SILM AAML 88 0 0 28 Jun 2024
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model Longrong Yang Dong Shen Chaoxiang Cai Fan Yang Size Li Tingting Gao Xi Li MoE 144 2 0 28 Jun 2024
LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks A. Bavaresco Raffaella Bernardi Leonardo Bertolazzi Desmond Elliott Raquel Fernández ... David Schlangen Alessandro Suglia Aditya K Surikuchi Ece Takmaz A. Testoni ALM ELM 177 88 0 26 Jun 2024
Grass: Compute Efficient Low-Memory LLM Training with Structured Sparse Gradients Aashiq Muhamed Oscar Li David Woodruff Mona Diab Virginia Smith 94 13 0 25 Jun 2024
TinyStyler: Efficient Few-Shot Text Style Transfer with Authorship Embeddings Zachary Horvitz Ajay Patel Kanishk Singh Chris Callison-Burch Kathleen McKeown Zhou Yu 85 5 0 21 Jun 2024
Information Guided Regularization for Fine-tuning Language Models Mandar Sharma Nikhil Muralidhar Shengzhe Xu Raquib Bin Yousuf Naren Ramakrishnan 97 0 0 20 Jun 2024
Open Generative Large Language Models for Galician Pablo Gamallo Pablo Rodríguez Iria de-Dios-Flores Susana Sotelo Silvia Paniagua Daniel Bardanca José Ramom Pichel Marcos Garcia 79 3 0 19 Jun 2024
Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy Interpolation Branislav Pecher Ján Cegin Róbert Belanec Jakub Simko Ivan Srba Maria Bielikova 83 1 0 18 Jun 2024
GW-MoE: Resolving Uncertainty in MoE Router with Global Workspace Theory Haoze Wu Zihan Qiu Zili Wang Hang Zhao Jie Fu MoE 96 3 0 18 Jun 2024
Knowledge Fusion By Evolving Weights of Language Models Guodong DU Yiyao Cao Hanting Liu Runhua Jiang Shuyang Yu Yifei Guo Sim Kuan Goh Jing Li MoMe 91 15 0 18 Jun 2024
UBench: Benchmarking Uncertainty in Large Language Models with Multiple Choice Questions Xunzhi Wang Zhuowei Zhang Qiongyu Li Gaonan Chen Mengting Hu Zhixin Han Bitong Luo Zhiyu li Hang Gao Mengting Hu ELM 107 3 0 18 Jun 2024
Style Transfer with Multi-iteration Preference Optimization Shuai Liu Jonathan May 64 4 0 17 Jun 2024
FamiCom: Further Demystifying Prompts for Language Models with Task-Agnostic Performance Estimation Bangzheng Li Ben Zhou Xingyu Fu Fei Wang Dan Roth Muhao Chen 81 6 0 17 Jun 2024
Symmetric Dot-Product Attention for Efficient Training of BERT Language Models Martin Courtois Malte Ostendorff Leonhard Hennig Georg Rehm 81 2 0 10 Jun 2024
SuperPos-Prompt: Enhancing Soft Prompt Tuning of Language Models with Superposition of Multi Token Embeddings MohammadAli SadraeiJavaeri Ehsaneddin Asgari A. Mchardy Hamid R. Rabiee VLM AAML 68 0 0 07 Jun 2024
VTrans: Accelerating Transformer Compression with Variational Information Bottleneck based Pruning Oshin Dutta Ritvik Gupta Sumeet Agarwal 93 2 0 07 Jun 2024
What Makes Language Models Good-enough? Daiki Asami Saku Sugawara 77 1 0 06 Jun 2024
Seeing the Forest through the Trees: Data Leakage from Partial Transformer Gradients Weijun Li Xingliang Yuan Mark Dras PILM 67 2 0 03 Jun 2024
Unveiling the Lexical Sensitivity of LLMs: Combinatorial Optimization for Prompt Enhancement Pengwei Zhan Zhen Xu Qian Tan Jie Song Ru Xie 81 7 0 31 May 2024
DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution Yulong Mao Kaiyu Huang Changhao Guan Ganglin Bao Fengran Mo Jinan Xu 96 17 0 27 May 2024
Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective Akiyoshi Tomihari Issei Sato 70 4 0 27 May 2024