Pretrained Transformers Improve Out-of-Distribution Robustness

13 April 2020

Papers citing "Pretrained Transformers Improve Out-of-Distribution Robustness"

50 / 109 papers shown

Title
Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation Reilly Haskins Benjamin Adams 14 0 0 16 May 2025
Efficient Unstructured Pruning of Mamba State-Space Models for Resource-Constrained Environments Ibne Farabi Shihab Sanjeda Akter Anuj Sharma Mamba 50 0 0 13 May 2025
Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources Renzhe Xu Kun Wang Bo Li 36 0 0 12 May 2025
A Perplexity and Menger Curvature-Based Approach for Similarity Evaluation of Large Language Models Yuantao Zhang Zhankui Yang AAML 38 0 0 05 Apr 2025
Uncertainty Distillation: Teaching Language Models to Express Semantic Confidence Sophia Hager David Mueller Kevin Duh Nicholas Andrews 69 0 0 18 Mar 2025
Reasoning Bias of Next Token Prediction Training Pengxiao Lin Zhongwang Zhang Zhi-Qin John Xu LRM 94 2 0 21 Feb 2025
Efficient Evaluation of Multi-Task Robot Policies With Active Experiment Selection Abrar Anwar Rohan Gupta Zain Merchant Sayan Ghosh Willie Neiswanger Jesse Thomason OffRL 67 1 0 14 Feb 2025
Seeking Consistent Flat Minima for Better Domain Generalization via Refining Loss Landscapes Aodi Li Liansheng Zhuang Xiao Long Minghong Yao Shafei Wang 216 0 0 18 Dec 2024
$$\texttt{MoE-RBench}$: Towards Building Reliable Language Models with Sparse Mixture-of-Experts$ $\texttt{MoE-RBench}$ : Towards Building Reliable Language Models with Sparse Mixture-of-Experts Guanjie Chen Xinyu Zhao Tianlong Chen Yu Cheng MoE 76 5 0 17 Jun 2024
Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification Hossam Zawbaa Wael Rashwan Sourav Dutta H. Assem OODD 46 0 0 30 May 2024
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems Patrick Emami Zhaonan Li Saumya Sinha Truc Nguyen 56 1 0 30 May 2024
Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study Chenguang Wang Ruoxi Jia Xin Liu Dawn Song VLM 29 7 0 15 Mar 2024
Towards Faithful Explanations: Boosting Rationalization with Shortcuts Discovery Linan Yue Qi Liu Yichao Du Li Wang Weibo Gao Yanqing An 34 5 0 12 Mar 2024
A Bayesian Approach to OOD Robustness in Image Classification Prakhar Kaushik Adam Kortylewski Alan L. Yuille 26 1 0 12 Mar 2024
Learning Shortcuts: On the Misleading Promise of NLU in Language Models Geetanjali Bihani Julia Taylor Rayz 33 3 0 17 Jan 2024
Towards Equipping Transformer with the Ability of Systematic Compositionality Chen Huang Peixin Qin Wenqiang Lei Jiancheng Lv 27 1 0 12 Dec 2023
Universal Domain Adaptation for Robust Handling of Distributional Shifts in NLP Hyuhng Joon Kim Hyunsoo Cho Sang-Woo Lee Junyeob Kim Choonghyun Park Sang-goo Lee Kang Min Yoo Taeuk Kim VLM OOD 48 1 0 23 Oct 2023
Mind the instructions: a holistic evaluation of consistency and interactions in prompt-based learning Lucas Weber Elia Bruni Dieuwke Hupkes 32 25 0 20 Oct 2023
Prompt-and-Align: Prompt-Based Social Alignment for Few-Shot Fake News Detection Jiaying Wu Xinyu Chen Haobin Yang Qi Zhao Yuhui Shi AAML 27 11 0 28 Sep 2023
How Good Are LLMs at Out-of-Distribution Detection? Bo Liu Li-Ming Zhan Zexin Lu Yu Feng Lei Xue Xiao-Ming Wu OODD 40 8 0 20 Aug 2023
Position: Key Claims in LLM Research Have a Long Tail of Footnotes Anna Rogers A. Luccioni 53 19 0 14 Aug 2023
Curricular Transfer Learning for Sentence Encoded Tasks Jader Martins Camboim de Sá Matheus Ferraroni Sanches R. R. Souza Júlio Cesar dos Reis Leandro A. Villas 21 0 0 03 Aug 2023
HOOD: Real-Time Human Presence and Out-of-Distribution Detection Using FMCW Radar Sabri Mustafa Kahya Muhammet Sami Yavuz Eckehard Steinbach 43 3 0 24 Jul 2023
Large Language Models as General Pattern Machines Suvir Mirchandani F. Xia Peter R. Florence Brian Ichter Danny Driess Montse Gonzalez Arenas Kanishka Rao Dorsa Sadigh Andy Zeng LLMAG 57 185 0 10 Jul 2023
Revisiting Out-of-distribution Robustness in NLP: Benchmark, Analysis, and LLMs Evaluations Lifan Yuan Yangyi Chen Ganqu Cui Hongcheng Gao Fangyuan Zou Xingyi Cheng Heng Ji Zhiyuan Liu Maosong Sun 39 73 0 07 Jun 2023
Measuring the Robustness of NLP Models to Domain Shifts Nitay Calderon Naveh Porat Eyal Ben-David Alexander Chapanin Zorik Gekhman Nadav Oved Vitaly Shalumov Roi Reichart 21 7 0 31 May 2023
From Adversarial Arms Race to Model-centric Evaluation: Motivating a Unified Automatic Robustness Evaluation Framework Yangyi Chen Hongcheng Gao Ganqu Cui Lifan Yuan Dehan Kong ... Longtao Huang H. Xue Zhiyuan Liu Maosong Sun Heng Ji AAML ELM 33 6 0 29 May 2023
Out-of-Distribution Generalization in Text Classification: Past, Present, and Future Linyi Yang Yangqiu Song Xuan Ren Chenyang Lyu Yidong Wang Lingqiao Liu Jindong Wang Jennifer Foster Yue Zhang OOD 37 2 0 23 May 2023
A Survey of Safety and Trustworthiness of Large Language Models through the Lens of Verification and Validation Xiaowei Huang Wenjie Ruan Wei Huang Gao Jin Yizhen Dong ... Sihao Wu Peipei Xu Dengyu Wu André Freitas Mustafa A. Mustafa ALM 45 83 0 19 May 2023
PreCog: Exploring the Relation between Memorization and Performance in Pre-trained Language Models Leonardo Ranaldi Elena Sofia Ruzzetti Fabio Massimo Zanzotto 33 6 0 08 May 2023
Calibration Error Estimation Using Fuzzy Binning Geetanjali Bihani Julia Taylor Rayz 97 2 0 30 Apr 2023
Fusion for Visual-Infrared Person ReID in Real-World Surveillance Using Corrupted Multimodal Data Arthur Josi Mahdi Alehdaghi Rafael M. O. Cruz Eric Granger 24 2 0 29 Apr 2023
UATTA-EB: Uncertainty-Aware Test-Time Augmented Ensemble of BERTs for Classifying Common Mental Illnesses on Social Media Posts Pratinav Seth Mihir Agarwal AI4MH 21 1 0 10 Apr 2023
Reconstruction-based Out-of-Distribution Detection for Short-Range FMCW Radar Sabri Mustafa Kahya Muhammet Sami Yavuz Eckehard Steinbach OODD 11 7 0 27 Feb 2023
A Comprehensive Survey on Source-free Domain Adaptation Zhiqi Yu Jingjing Li Zhekai Du Lei Zhu H. Shen TTA 31 96 0 23 Feb 2023
How Does Beam Search improve Span-Level Confidence Estimation in Generative Sequence Labeling? Kazuma Hashimoto Iftekhar Naim K. Raman UQLM 29 2 0 21 Dec 2022
Beyond Mahalanobis-Based Scores for Textual OOD Detection Pierre Colombo Eduardo Dadalto Camara Gomes Guillaume Staerman Nathan Noiry Pablo Piantanida OODD 54 5 0 24 Nov 2022
Delving into Out-of-Distribution Detection with Vision-Language Representations Yifei Ming Ziyan Cai Jiuxiang Gu Yiyou Sun W. Li Yixuan Li VLM OODD 61 159 0 24 Nov 2022
Multi-Level Knowledge Distillation for Out-of-Distribution Detection in Text Qianhui Wu Huiqiang Jiang Haonan Yin Börje F. Karlsson Chin-Yew Lin 35 10 0 21 Nov 2022
GLUE-X: Evaluating Natural Language Understanding Models from an Out-of-distribution Generalization Perspective Linyi Yang Shuibai Zhang Libo Qin Yafu Li Yidong Wang Hanmeng Liu Jindong Wang Xingxu Xie Yue Zhang ELM 46 79 0 15 Nov 2022
The future is different: Large pre-trained language models fail in prediction tasks K. Cvejoski Ramses J. Sanchez C. Ojeda 22 3 0 01 Nov 2022
Progressive Sentiment Analysis for Code-Switched Text Data Sudhanshu Ranjan Dheeraj Mekala Jingbo Shang 29 4 0 25 Oct 2022
Exploring Mode Connectivity for Pre-trained Language Models Yujia Qin Cheng Qian Jing Yi Weize Chen Yankai Lin Xu Han Zhiyuan Liu Maosong Sun Jie Zhou 29 20 0 25 Oct 2022
Why Should Adversarial Perturbations be Imperceptible? Rethink the Research Paradigm in Adversarial NLP Yangyi Chen Hongcheng Gao Ganqu Cui Fanchao Qi Longtao Huang Zhiyuan Liu Maosong Sun SILM 25 45 0 19 Oct 2022
Evaluating Out-of-Distribution Performance on Document Image Classifiers Stefan Larson Gordon Lim Yutong Ai David Kuang Kevin Leach OODD OOD 37 18 0 14 Oct 2022
The Open-World Lottery Ticket Hypothesis for OOD Intent Classification Yunhua Zhou Pengyu Wang Peiju Liu Yuxin Wang Xipeng Qiu 25 2 0 13 Oct 2022
Uncertainty Quantification with Pre-trained Language Models: A Large-Scale Empirical Analysis Yuxin Xiao Paul Pu Liang Umang Bhatt W. Neiswanger Ruslan Salakhutdinov Louis-Philippe Morency 175 86 0 10 Oct 2022
Using Interventions to Improve Out-of-Distribution Generalization of Text-Matching Recommendation Systems Parikshit Bansal Yashoteja Prabhu Emre Kıcıman Amit Sharma CML OOD 33 0 0 07 Oct 2022
State-of-the-art generalisation research in NLP: A taxonomy and review Dieuwke Hupkes Mario Giulianelli Verna Dankers Mikel Artetxe Yanai Elazar ... Leila Khalatbari Maria Ryskina Rita Frieske Ryan Cotterell Zhijing Jin 121 94 0 06 Oct 2022
Goal Misgeneralization: Why Correct Specifications Aren't Enough For Correct Goals Rohin Shah Vikrant Varma Ramana Kumar Mary Phuong Victoria Krakovna J. Uesato Zachary Kenton 40 68 0 04 Oct 2022