MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering

27 March 2022

Ankit Pal

Logesh Kumar Umapathi

Malaikannan Sankarasubbu

ELM

LM&MA

ArXiv PDF HTML

Papers citing "MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering"

50 / 63 papers shown

Title
ExpertSteer: Intervening in LLMs through Expert Knowledge Weixuan Wang Minghao Wu Barry Haddow Alexandra Birch LLMSV 19 0 0 18 May 2025
MedGUIDE: Benchmarking Clinical Decision-Making in Large Language Models Xiaomin Li Mingye Gao Yuexing Hao Taoran Li Guangya Wan Zihan Wang Yijun Wang LM&MA ELM AI4MH 27 0 0 16 May 2025
Disentangling Reasoning and Knowledge in Medical Large Language Models Rahul Thapa Qingyang Wu Kevin Wu Harrison Zhang Angela Zhang ... Joseph Boen Shriya Reddy Ben Athiwaratkun Shuaiwen Leon Song James Zou ELM AI4MH LM&MA LRM 25 0 0 16 May 2025
Large Language Models for Cancer Communication: Evaluating Linguistic Quality, Safety, and Accessibility in Generative AI Agnik Saha Victoria Churchill Anny D. Rodriguez Ugur Kursuncu Muhammed Y. Idris LM&MA ELM 42 0 0 15 May 2025
System Prompt Optimization with Meta-Learning Yumin Choi Jinheon Baek Sung Ju Hwang LLMAG 53 0 0 14 May 2025
Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information Joshua Harris Fan Grayson Felix Feldman Timothy Laurence Toby Nonnenmacher ... Leo Loman Selina Patel Thomas Finnie Samuel Collins Michael Borowitz AI4MH LM&MA ELM 54 0 0 09 May 2025
MARK: Memory Augmented Refinement of Knowledge Anish Ganguli Prabal Deb Debleena Banerjee CLL 78 0 0 08 May 2025
Multimodal Large Language Models for Medicine: A Comprehensive Survey Jiarui Ye Hao Tang LM&MA 91 0 0 29 Apr 2025
Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization Wataru Kawakami Keita Suzuki Junichiro Iwasawa LRM 75 0 0 25 Apr 2025
Virology Capabilities Test (VCT): A Multimodal Virology Q&A Benchmark Jasper Götting Pedro Medeiros Jon G Sanders Nathaniel Li Long Phan Karam Elabd Lennart Justen Dan Hendrycks Seth Donoughe ELM 63 2 0 21 Apr 2025
DMind Benchmark: Toward a Holistic Assessment of LLM Capabilities across the Web3 Domain Enhao Huang Rainy Sun Anya Reese Alex Chen Alex Chen ... Gang Zhao Garry Zhao Frank Li Hobert Wong Lowes Yang ALM ELM 77 0 0 18 Apr 2025
Gauging Overprecision in LLMs: An Empirical Study Adil Bahaj Hamed Rahimi Mohamed Chetouani Mounir Ghogho 75 0 0 16 Apr 2025
MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs Juncheng Wu Wenlong Deng Xiaochen Li Sheng Liu Taomian Mi ... Yihan Cao Hui Ren Xuzhao Li Xiaoxiao Li Yuyin Zhou AI4MH LRM 63 4 0 01 Apr 2025
GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning Jian Zhao Runze Liu Kaiyan Zhang Zhimu Zhou Junqi Gao ... Jiafei Lyu Zhouyi Qian Biqing Qi Xiu Li Bowen Zhou OffRL LRM 37 6 0 01 Apr 2025
Efficient Algorithms for Verifying Kruskal Rank in Sparse Linear Regression and Related Applications Fengqin Zhou 66 0 0 06 Mar 2025
Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support G. Wang Minyu Gao Shuai Yang Ya Zhang Lizhi He ... Yexuan Zhang Wanyue Li Lu Chen Jintao Fei Xin Li 188 1 0 25 Feb 2025
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning Haiteng Zhao Chang Ma FangZhi Xu Lingpeng Kong Zhi-Hong Deng LRM 55 2 0 23 Feb 2025
Language Models Can Predict Their Own Behavior Dhananjay Ashok Jonathan May ReLM AI4TS LRM 63 0 0 18 Feb 2025
The Order Effect: Investigating Prompt Sensitivity to Input Order in LLMs Bryan Guan Tanya Roosta Peyman Passban Mehdi Rezagholizadeh 102 0 0 06 Feb 2025
A Survey of Large Language Models for Healthcare: from Data, Technology, and Applications to Accountability and Ethics Kai He Rui Mao Qika Lin Yucheng Ruan Xiang Lan Mengling Feng Min Zhang LM&MA AILaw 107 157 0 28 Jan 2025
Data Extraction Attacks in Retrieval-Augmented Generation via Backdoors Yuefeng Peng Junda Wang Hong-ye Yu Amir Houmansadr SILM 68 2 0 03 Nov 2024
Latent Paraphrasing: Perturbation on Layers Improves Knowledge Injection in Language Models Minki Kang Sung Ju Hwang Gibbeum Lee Jaewoong Cho KELM 43 0 0 01 Nov 2024
Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts Guorui Zheng Xidong Wang Juhao Liang Nuo Chen Yuping Zheng Benyou Wang MoE 37 5 0 14 Oct 2024
MentalArena: Self-play Training of Language Models for Diagnosis and Treatment of Mental Health Disorders Cheng-rong Li May Fung Qingyun Wang Chi Han Manling Li Jindong Wang Heng Ji AI4MH 227 0 0 09 Oct 2024
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe Yuxin Xiao Shujian Zhang Wenxuan Zhou Marzyeh Ghassemi Sanqiang Zhao 189 0 0 07 Oct 2024
Reward-RAG: Enhancing RAG with Reward Driven Supervision Thang Nguyen Peter Chin Yu-Wing Tai RALM 45 4 0 03 Oct 2024
HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations Ziyu Wang Hao Li Di Huang Amir M. Rahmani Chae-Won Shin Amir M. Rahmani LM&MA 48 9 0 28 Sep 2024
DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models Bowen Wang Jiuyang Chang Yiming Qian Guoxin Chen Junhao Chen Zhouqiang Jiang Jiahao Zhang Yuta Nakashima Hajime Nagahara LM&MA ELM LRM 40 3 0 04 Aug 2024
MoFO: Momentum-Filtered Optimizer for Mitigating Forgetting in LLM Fine-Tuning Yupeng Chen Senmiao Wang Zhihang Lin Zhihang Lin Yushun Zhang Tian Ding Ruoyu Sun Ruoyu Sun CLL 83 3 0 30 Jul 2024
CollectiveSFT: Scaling Large Language Models for Chinese Medical Benchmark with Collective Instructions in Healthcare Jingwei Zhu Minghuan Tan Min Yang Ruixue Li Hamid Alinejad-Rokny ALM LM&MA 38 0 0 29 Jul 2024
Are Large Language Models True Healthcare Jacks-of-All-Trades? Benchmarking Across Health Professions Beyond Physician Exams Zheheng Luo Chenhan Yuan Qianqian Xie Sophia Ananiadou ELM AI4MH LM&MA 51 0 0 17 Jun 2024
Applications of Generative AI in Healthcare: algorithmic, ethical, legal and societal considerations Onyekachukwu R. Okonji Kamol Yunusov Bonnie Gordon MedIm 46 3 0 15 Jun 2024
A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations Jinqiang Wang Huansheng Ning Yi Peng Qikai Wei Daniel Tesfai Wenwei Mao Tao Zhu Runhe Huang LM&MA AI4MH ELM 51 5 0 14 Jun 2024
SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models Kehua Feng Keyan Ding Weijie Wang Xiang Zhuang Zeyuan Wang Ming Qin Yu Zhao Jianhua Yao Qiang Zhang H. Chen ELM 50 6 0 13 Jun 2024
UltraMedical: Building Specialized Generalists in Biomedicine Kaiyan Zhang Sihang Zeng Ermo Hua Ning Ding Zhang-Ren Chen ... Ganqu Cui Xingtai Lv Hu Jinfang Zhiyuan Liu Bowen Zhou LM&MA 45 22 0 06 Jun 2024
Nearest Neighbor Speculative Decoding for LLM Generation and Attribution Minghan Li Xilun Chen Ari Holtzman Beidi Chen Jimmy Lin Wen-tau Yih Xi Lin RALM BDL 108 10 0 29 May 2024
Self-Reflection in LLM Agents: Effects on Problem-Solving Performance Matthew Renze Erhan Guven LRM LLMAG 46 40 0 05 May 2024
Unveiling LLM Evaluation Focused on Metrics: Challenges and Solutions Taojun Hu Xiao-Hua Zhou ELM 43 13 0 14 Apr 2024
MedExpQA: Multilingual Benchmarking of Large Language Models for Medical Question Answering Inigo Alonso Maite Oronoz Rodrigo Agerri AI4MH LM&MA ELM 59 16 1 08 Apr 2024
Gecko: Versatile Text Embeddings Distilled from Large Language Models Jinhyuk Lee Zhuyun Dai Xiaoqi Ren Blair Chen Daniel Cer ... Aditya Kusupati Prateek Jain Siddhartha Reddy Jonnalagadda Ming-Wei Chang Iftekhar Naim RALM VLM SyDa 50 41 0 29 Mar 2024
Apollo: A Lightweight Multilingual Medical LLM towards Democratizing Medical AI to 6B People Xidong Wang Nuo Chen Junying Chen Yan Hu Yidong Wang Xiangbo Wu Anningzhe Gao Xiang Wan Haizhou Li Benyou Wang LM&MA 48 25 0 06 Mar 2024
Retrieval is Accurate Generation Bowen Cao Deng Cai Leyang Cui Xuxin Cheng Wei Bi Yuexian Zou Shuming Shi 40 6 0 27 Feb 2024
InMD-X: Large Language Models for Internal Medicine Doctors Hansle Gwon Imjin Ahn Hyoje Jung Byeolhee Kim Young-Hak Kim Tae Joon Jun LM&MA 44 1 0 19 Feb 2024
The Effect of Sampling Temperature on Problem Solving in Large Language Models Matthew Renze Erhan Guven 60 75 0 07 Feb 2024
Institutional Platform for Secure Self-Service Large Language Model Exploration V. Bumgardner Mitchell A. Klusty W. V. Logan Samuel E. Armstrong Caylin D. Hickey Jeff Talbert Caylin Hickey Jeff Talbert 66 1 0 01 Feb 2024
Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models Minbyul Jeong Jiwoong Sohn Mujeen Sung Jaewoo Kang 25 29 0 27 Jan 2024
HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs Junying Chen Xidong Wang Anningzhe Gao Feng Jiang Shunian Chen ... Chuyi Kong Jianquan Li Xiang Wan Haizhou Li Benyou Wang LM&MA 24 60 0 16 Nov 2023
Baichuan 2: Open Large-scale Language Models Ai Ming Yang Bin Xiao Bingning Wang Borong Zhang Ce Bian ... Youxin Jiang Yuchen Gao Yupeng Zhang Zenan Zhou Zhiying Wu ELM LRM 77 712 0 19 Sep 2023
Aligning Large Language Models for Clinical Tasks Supun Manathunga Isuru Hettigoda LM&MA ELM AI4MH 36 10 0 06 Sep 2023
MedAlign: A Clinician-Generated Dataset for Instruction Following with Electronic Medical Records Scott L. Fleming Alejandro Lozano W. Haberkorn Jenelle A. Jindal E. Reis ... Jonathan Chen Keith Morse Emma Brunskill Jason Alan Fries N. Shah LM&MA 30 54 0 27 Aug 2023