Look at the First Sentence: Position Bias in Question Answering

30 April 2020

Papers citing "Look at the First Sentence: Position Bias in Question Answering"

27 / 27 papers shown

Title
FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning Jie Ma Zhitao Gao Qi Chai Jun Liu Peijie Wang Jing Tao Zhou Su 63 1 0 01 Apr 2025
Survey and Improvement Strategies for Gene Prioritization with Large Language Models Matthew Neeley Guantong Qi Guanchu Wang Ruixiang Tang Dongxue Mao ... Bo Yuan Fan Xia Pengfei Liu Zhandong Liu Xia Hu LM&MA 106 0 0 30 Jan 2025
MACPO: Weak-to-Strong Alignment via Multi-Agent Contrastive Preference Optimization Yougang Lyu Lingyong Yan Zihan Wang Dawei Yin Pengjie Ren Maarten de Rijke Z. Z. Ren 63 6 0 10 Oct 2024
Detecting Bias and Enhancing Diagnostic Accuracy in Large Language Models for Healthcare Pardis Sadat Zahraei Zahra Shakeri LM&MA 26 0 0 09 Oct 2024
First Heuristic Then Rational: Dynamic Use of Heuristics in Language Model Reasoning Yoichi Aoki Keito Kudo Tatsuki Kuribayashi Shusaku Sone Masaya Taniguchi Keisuke Sakaguchi Kentaro Inui LRM 29 1 0 23 Jun 2024
RuleR: Improving LLM Controllability by Rule-based Data Recycling Ming Li Han Chen Chenguang Wang Dang Nguyen Dianqi Li Dinesh Manocha 28 7 0 22 Jun 2024
CoEvol: Constructing Better Responses for Instruction Finetuning through Multi-Agent Cooperation Renhao Li Minghuan Tan Derek F. Wong Min Yang LLMAG 23 1 0 11 Jun 2024
Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering Jie Ma Min Hu Pinghui Wang Wangchun Sun Lingyun Song Hongbin Pei Jun Liu Youtian Du 39 4 0 18 Apr 2024
Self-Demos: Eliciting Out-of-Demonstration Generalizability in Large Language Models Wei He Shichun Liu Jun Zhao Yiwen Ding Yi Lu Zhiheng Xi Tao Gui Qi Zhang Xuanjing Huang 44 1 0 01 Apr 2024
Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction Kuniaki Saito Kihyuk Sohn Chen-Yu Lee Yoshitaka Ushiku 66 2 0 16 Feb 2024
Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning Ming Li Lichang Chen Jiuhai Chen Shwai He Jiuxiang Gu Dinesh Manocha 29 52 0 15 Feb 2024
Self-Supervised Position Debiasing for Large Language Models Zhongkun Liu Zheng Chen Mengqi Zhang Zhaochun Ren Pengjie Ren Zhumin Chen 36 1 0 02 Jan 2024
JudgeLM: Fine-tuned Large Language Models are Scalable Judges Lianghui Zhu Xinggang Wang Xinlong Wang ELM ALM 62 112 0 26 Oct 2023
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena Lianmin Zheng Wei-Lin Chiang Ying Sheng Siyuan Zhuang Zhanghao Wu ... Dacheng Li Eric Xing Haotong Zhang Joseph E. Gonzalez Ion Stoica ALM OSLM ELM 51 3,854 0 09 Jun 2023
AMR4NLI: Interpretable and robust NLI measures from semantic graphs Juri Opitz Shira Wein Julius Steen Anette Frank Nathan Schneider 47 0 0 01 Jun 2023
Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models Lukávs Mikula Michal vStefánik Marek Petrovivc Petr Sojka 41 3 0 11 May 2023
A Frustratingly Easy Improvement for Position Embeddings via Random Padding Mingxu Tao Yansong Feng Dongyan Zhao 34 6 0 08 May 2023
Analyzing the Effectiveness of the Underlying Reasoning Tasks in Multi-hop Question Answering Xanh Ho A. Nguyen Saku Sugawara Akiko Aizawa LRM 44 7 0 12 Feb 2023
The Tail Wagging the Dog: Dataset Construction Biases of Social Bias Benchmarks Nikil Selvam Sunipa Dev Daniel Khashabi Tushar Khot Kai-Wei Chang ALM 24 25 0 18 Oct 2022
A Survey on Measuring and Mitigating Reasoning Shortcuts in Machine Reading Comprehension Xanh Ho Johannes Mario Meissner Saku Sugawara Akiko Aizawa OffRL 35 4 0 05 Sep 2022
Shortcut Learning of Large Language Models in Natural Language Understanding Mengnan Du Fengxiang He Na Zou Dacheng Tao Xia Hu KELM OffRL 40 84 0 25 Aug 2022
Can Rationalization Improve Robustness? Howard Chen Jacqueline He Karthik R. Narasimhan Danqi Chen AAML 29 40 0 25 Apr 2022
Saving Dense Retriever from Shortcut Dependency in Conversational Search Sungdong Kim Gangwoo Kim 25 26 0 15 Feb 2022
Introspective Distillation for Robust Question Answering Yulei Niu Hanwang Zhang 27 59 0 01 Nov 2021
Semantic Answer Similarity for Evaluating Question Answering Models Julian Risch Timo Moller Julian Gutsch M. Pietsch ELM 32 67 0 13 Aug 2021
How Do Your Biomedical Named Entity Recognition Models Generalize to Novel Entities? Hyunjae Kim Jaewoo Kang AI4CE 86 21 0 01 Jan 2021
Hypothesis Only Baselines in Natural Language Inference Adam Poliak Jason Naradowsky Aparajita Haldar Rachel Rudinger Benjamin Van Durme 190 576 0 02 May 2018