BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions

24 May 2019

Papers citing "BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions"

50 / 1,143 papers shown

Title
Progressive Binarization with Semi-Structured Pruning for LLMs Xinyu Yan Tianao Zhang Zhiteng Li Yulun Zhang MQ 134 1 0 01 Jul 2025
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation Shen Yuan Yin Zheng Taifeng Wang Binbin Liu Hongteng Xu MoMe 23 0 0 01 Jul 2025
Revisiting LoRA through the Lens of Parameter Redundancy: Spectral Encoding Helps Jiashun Cheng Aochuan Chen Nuo Chen Ziqi Gao Yuhan Li Jia Li Fugee Tsung 12 0 0 20 Jun 2025
Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights Zhiyuan Liang Dongwen Tang Yuhao Zhou Xuanlei Zhao Mingjia Shi ... Damian Borth Michael M. Bronstein Yang You Zhangyang Wang Kai Wang OffRL 14 0 0 19 Jun 2025
SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity Samir Khaki Xiuyu Li Junxian Guo Ligeng Zhu Chenfeng Xu Konstantinos N. Plataniotis Amir Yazdanbakhsh Kurt Keutzer Song Han Zhijian Liu 9 0 0 19 Jun 2025
Efficient and Privacy-Preserving Soft Prompt Transfer for LLMs Xun Wang Jing Xu Franziska Boenisch Michael Backes Christopher A. Choquette-Choo Adam Dziedzic AAML 14 0 0 19 Jun 2025
Improving LoRA with Variational Learning Bai Cong Nico Daheim Yuesong Shen Rio Yokota Mohammad Emtiyaz Khan Thomas Möllenhoff 19 0 0 17 Jun 2025
Massive Supervised Fine-tuning Experiments Reveal How Data, Layer, and Training Factors Shape LLM Alignment Quality Yuto Harada Yusuke Yamauchi Yusuke Oda Yohei Oseki Yusuke Miyao Yu Takagi ALM 17 0 0 17 Jun 2025
EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization Zhongqian Fu Ning Ding Kai Han Xianzhi Yu Xiaosong Li Xinghao Chen Yehui Tang Yunhe Wang MQ MoE 12 0 0 16 Jun 2025
Just Go Parallel: Improving the Multilingual Capabilities of Large Language Models Muhammad Reza Qorib Junyi Li Hwee Tou Ng LRM 16 0 0 16 Jun 2025
TensorSLM: Energy-efficient Embedding Compression of Sub-billion Parameter Language Models on Low-end Devices Mingxue Xu Y. Xu Danilo Mandic 21 0 0 16 Jun 2025
Mitigating Safety Fallback in Editing-based Backdoor Injection on LLMs Houcheng Jiang Zetong Zhao Junfeng Fang Haokai Ma Ruipeng Wang Yang Deng Xiang Wang Xiangnan He KELM AAML 14 0 0 16 Jun 2025
MEraser: An Effective Fingerprint Erasure Approach for Large Language Models Jingxuan Zhang Zhenhua Xu Rui Hu Wenpeng Xing Xuhong Zhang Meng Han AAML 5 0 0 14 Jun 2025
LoRA-Gen: Specializing Large Language Model via Online LoRA Generation Yicheng Xiao Lin Song Rui Yang Cheng Cheng Yixiao Ge Xiu Li Y. Shan OffRL 17 0 0 13 Jun 2025
Beyond Random Sampling: Efficient Language Model Pretraining via Curriculum Learning Yang Zhang Amr Mohamed Hadi Abdine Guokan Shang Michalis Vazirgiannis 15 0 0 12 Jun 2025
One Tokenizer To Rule Them All: Emergent Language Plasticity via Multilingual Tokenizers Diana Abagyan Alejandro Salamanca Andres Felipe Cruz-Salinas Kris Cao Hangyu Lin Acyr Locatelli Marzieh Fadaee Ahmet Üstün Sara Hooker CLL 126 0 0 12 Jun 2025
DIVE into MoE: Diversity-Enhanced Reconstruction of Large Language Models from Dense into Mixture-of-Experts Yuchen Feng Bowen Shen Naibin Gu Jiaxuan Zhao Peng Fu Zheng Lin Weiping Wang MoMe MoE 47 0 0 11 Jun 2025
Olica: Efficient Structured Pruning of Large Language Models without Retraining Jiujun He Huazhen Lin 24 0 0 10 Jun 2025
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving Yongkang Li Kaixin Xiong Xiangyu Guo Fang Li Sixu Yan ... Bing Wang Guang Chen Hangjun Ye Wenyu Liu Xinggang Wang VLM 16 0 0 09 Jun 2025
Promoting Ensemble Diversity with Interactive Bayesian Distributional Robustness for Fine-tuning Foundation Models Ngoc-Quan Pham Tuan Truong Quyen Tran T. H. Nguyen Dinh Q. Phung T. Le 34 1 0 08 Jun 2025
Learning Distribution-Wise Control in Representation Space for Language Models Chunyuan Deng Ruidi Chang Hanjie Chen 17 0 0 07 Jun 2025
Adapt Once, Thrive with Updates: Transferable Parameter-Efficient Fine-Tuning on Evolving Base Models Naibin Gu Peng Fu Xiyu Liu Ke Ma Zheng Lin Weiping Wang 14 0 0 07 Jun 2025
Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation Zhan Zhuang Xiequn Wang Wei Li Yulong Zhang Qiushi Huang ... Yanbin Wei Yuhe Nie Kede Ma Yu Zhang Ying Wei 48 0 0 06 Jun 2025
MoA: Heterogeneous Mixture of Adapters for Parameter-Efficient Fine-Tuning of Large Language Models Jie Cao Tianwei Lin Hongyang He Rolan Yan Wenqiao Zhang Juncheng Billy Li D. Zhang Siliang Tang Yueting Zhuang MoE 41 0 0 06 Jun 2025
Text-to-LoRA: Instant Transformer Adaption Rujikorn Charakorn Edoardo Cetin Yujin Tang Robert Tjarko Lange AI4CE 46 0 0 06 Jun 2025
Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias Yuanzhe Hu Kinshuk Goel Vlad Killiakov Yaoqing Yang 47 2 0 06 Jun 2025
DynamicMind: A Tri-Mode Thinking System for Large Language Models Wei Li Yanbin Wei Qiushi Huang Jiangyue Yan Yang Chen James T. Kwok Yu Zhang LLMAG LRM 41 0 0 06 Jun 2025
MesaNet: Sequence Modeling by Locally Optimal Test-Time Training J. Oswald Nino Scherrer Seijin Kobayashi Luca Versari Songlin Yang ... Guillaume Lajoie Charlotte Frenkel Razvan Pascanu Blaise Agüera y Arcas João Sacramento 84 1 0 05 Jun 2025
APT: Improving Specialist LLM Performance with Weakness Case Acquisition and Iterative Preference Training Jun Rao Zepeng Lin Xuebo Liu Xiaopeng Ke Lian Lian Dong Jin Shengjun Cheng Jun Yu Min Zhang 101 0 0 04 Jun 2025
From Understanding to Generation: An Efficient Shortcut for Evaluating Language Models Viktor Hangya Fabian Küch Darina Gold ELM 54 0 0 04 Jun 2025
TokAlign: Efficient Vocabulary Adaptation via Token Alignment Chong Li Jiajun Zhang Chengqing Zong VLM 53 0 0 04 Jun 2025
Accurate Sublayer Pruning for Large Language Models by Exploiting Latency and Tunability Information Seungcheol Park Sojin Lee Jongjin Kim Jinsik Lee Hyunjik Jo U. Kang 64 2 0 04 Jun 2025
SkipGPT: Dynamic Layer Pruning Reinvented with Token Awareness and Module Decoupling Anhao Zhao Fanghua Ye Yingqi Fan Junlong Tong Zhiwei Fei Hui Su Xiaoyu Shen 66 0 0 04 Jun 2025
PoLAR: Polar-Decomposed Low-Rank Adapter Representation Kai Lion Liang Zhang Bingcong Li Niao He 53 0 0 03 Jun 2025
Adaptive Task Vectors for Large Language Models Joonseong Kang Soojeong Lee Subeen Park Sumin Park Taero Kim Jihee Kim Ryunyi Lee Kyungwoo Song 27 0 0 03 Jun 2025
ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge Chaoyue He Xin Zhou Y. Wu Xinjia Yu Yan Zhang ... Shengfei Lyu Hong Xu X. Wang Wei Liu Chunyan Miao ELM 45 0 0 02 Jun 2025
Taming LLMs by Scaling Learning Rates with Gradient Grouping Siyuan Li Juanxi Tian Zedong Wang Xin Jin Zicheng Liu Wentao Zhang Dan Xu 30 0 0 01 Jun 2025
Probing the Geometry of Truth: Consistency and Generalization of Truth Directions in LLMs Across Logical Transformations and Question Answering Tasks Yuntai Bao Xuhong Zhang Tianyu Du Xinkui Zhao Zhengwen Feng Hao Peng Jianwei Yin HILM 42 0 0 01 Jun 2025
Revisiting Epistemic Markers in Confidence Estimation: Can Markers Accurately Reflect Large Language Models' Uncertainty? Jiayu Liu Qing Zong Weiqi Wang Yangqiu Song 30 0 0 30 May 2025
Stepsize anything: A unified learning rate schedule for budgeted-iteration training Anda Tang Yiming Dong Yutao Zeng zhou Xun Zhouchen Lin 352 0 0 30 May 2025
LittleBit: Ultra Low-Bit Quantization via Latent Factorization Banseok Lee Dongkyu Kim Youngcheon You Youngmin Kim MQ 13 0 0 30 May 2025
Diversity of Transformer Layers: One Aspect of Parameter Scaling Laws Hidetaka Kamigaito Ying Zhang Jingun Kwon Katsuhiko Hayashi Manabu Okumura Taro Watanabe MoE 40 1 0 29 May 2025
TSENOR: Highly-Efficient Algorithm for Finding Transposable N:M Sparse Masks X. Meng Mehdi Makni Rahul Mazumder 15 0 0 29 May 2025
Matryoshka Model Learning for Improved Elastic Student Models Chetan Verma Aditya Srinivas Timmaraju Cho-Jui Hsieh Suyash Damle Ngot Bui Y. Zhang Wen Chen Xin Liu Prateek Jain Inderjit S Dhillon 86 0 0 29 May 2025
Differential Information: An Information-Theoretic Perspective on Preference Optimization Yunjae Won Hyunji Lee Hyeonbin Hwang Minjoon Seo 21 0 0 29 May 2025
MAP: Revisiting Weight Decomposition for Low-Rank Adaptation Chongjie Si Zhiyi Shi Yadao Wang Xiaokang Yang Susanto Rahardja Wei Shen 53 0 0 29 May 2025
ATLAS: Learning to Optimally Memorize the Context at Test Time Ali Behrouz Zeman Li Praneeth Kacham Majid Daliri Yuan Deng Peilin Zhong Meisam Razaviyayn Vahab Mirrokni 76 2 0 29 May 2025
SlimLLM: Accurate Structured Pruning for Large Language Models Jialong Guo Xinghao Chen Yehui Tang Yunhe Wang 11 0 0 28 May 2025
Highly Efficient and Effective LLMs with Multi-Boolean Architectures Ba-Hien Tran Van Minh Nguyen MQ 40 0 0 28 May 2025
MoRE: A Mixture of Low-Rank Experts for Adaptive Multi-Task Learning Dacao Zhang Kun Zhang Shimao Chu Le Wu Xin Li Si Wei MoE ALM OffRL 25 0 0 28 May 2025