CoQA: A Conversational Question Answering Challenge

21 August 2018

Siva Reddy

Danqi Chen

Christopher D. Manning

RALM

HAI

ArXiv PDF HTML

Papers citing "CoQA: A Conversational Question Answering Challenge"

50 / 251 papers shown

Title
$$\texttt{DIAMONDs}$: A Dataset for $\mathbb{D}$ynamic $\mathbb{I}$nformation $\mathbb{A}$nd $\mathbb{M}$ental modeling $\mathbb{O}$f $\mathbb{N}$umeric $\mathbb{D}$iscussions$ $\texttt{DIAMONDs}$ : A Dataset for $\mathbb{D}$ ynamic $\mathbb{I}$ nformation $\mathbb{A}$ nd $\mathbb{M}$ ental modeling $\mathbb{O}$ f $\mathbb{N}$ umeric $\mathbb{D}$ iscussions Sayontan Ghosh Mahnaz Koupaee Yash Kumar Lal Pegah Alipoormolabashi Mohammad Saqib Hasan Jun Seok Kang Niranjan Balasubramanian 12 0 0 19 May 2025
MergeBench: A Benchmark for Merging Domain-Specialized LLMs Yifei He Siqi Zeng Yuzheng Hu Rui Yang Tong Zhang Han Zhao MoMe ALM 24 0 0 16 May 2025
WorldView-Bench: A Benchmark for Evaluating Global Cultural Perspectives in Large Language Models Abdullah Mushtaq Imran Taj Rafay Naeem Ibrahim Ghaznavi Junaid Qadir 26 0 0 14 May 2025
LLMs Get Lost In Multi-Turn Conversation Philippe Laban Hiroaki Hayashi Yingbo Zhou Jennifer Neville 50 1 0 09 May 2025
Scalable LLM Math Reasoning Acceleration with Low-rank Distillation Harry Dong Bilge Acun Beidi Chen Yuejie Chi LRM 34 0 0 08 May 2025
Invoke Interfaces Only When Needed: Adaptive Invocation for Large Language Models in Question Answering Jihao Zhao Chunlai Zhou Biao Qin 55 0 0 05 May 2025
EnronQA: Towards Personalized RAG over Private Documents Michael J. Ryan Danmei Xu Chris Nivera Daniel Campos SILM 69 1 0 01 May 2025
Calibrating Uncertainty Quantification of Multi-Modal LLMs using Grounding Trilok Padhi R. Kaur Adam D. Cobb Manoj Acharya Anirban Roy Colin Samplawski Brian Matejek Alexander M. Berenbeim Nathaniel D. Bastian Susmit Jha 28 0 0 30 Apr 2025
MAC-Tuning: LLM Multi-Compositional Problem Reasoning with Enhanced Knowledge Boundary Awareness Junsheng Huang Zhitao He Sandeep Polisetty Q. Wang May Fung KELM 47 0 0 30 Apr 2025
DYNAMAX: Dynamic computing for Transformers and Mamba based architectures Miguel Nogales Matteo Gambella Manuel Roveri 56 0 0 29 Apr 2025
Random-Set Large Language Models Muhammad Mubashar Shireen Kudukkil Manchingal Fabio Cuzzolin 66 0 0 25 Apr 2025
LLM-as-a-Judge: Reassessing the Performance of LLMs in Extractive QA Xanh Ho Jiahao Huang Florian Boudin Akiko Aizawa ELM 36 0 0 16 Apr 2025
Hallucination Detection in LLMs via Topological Divergence on Attention Graphs Alexandra Bazarova Aleksandr Yugay Andrey Shulga A. Ermilova Andrei Volodichev ... Dmitry Simakov M. Savchenko Andrey Savchenko Serguei Barannikov Alexey Zaytsev HILM 35 0 0 14 Apr 2025
ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering Ahmed Masry Mohammed Saidul Islam Mahir Ahmed Aayush Bajaj Firoz Kabir ... Mehrad Shahmohammadi Megh Thakkar Md. Rizwan Parvez E. Hoque Chenyu You ELM 33 0 0 07 Apr 2025
Adaptive Layer-skipping in Pre-trained LLMs Xuan Luo Weizhi Wang Xifeng Yan 197 0 0 31 Mar 2025
SuperBPE: Space Travel for Language Models Alisa Liu J. Hayase Valentin Hofmann Sewoong Oh Noah A. Smith Yejin Choi 51 3 0 17 Mar 2025
HybridNorm: Towards Stable and Efficient Transformer Training via Hybrid Normalization Zhijian Zhuo Yutao Zeng Ya Wang Sijun Zhang Jian Yang Xiaoqing Li Xun Zhou Jinwen Ma 51 0 0 06 Mar 2025
Wrong Answers Can Also Be Useful: PlausibleQA -- A Large-Scale QA Dataset with Answer Plausibility Scores Jamshid Mozafari Abdelrahman Abdallah Bhawna Piryani Adam Jatowt 47 0 0 22 Feb 2025
Large Language Model Confidence Estimation via Black-Box Access Tejaswini Pedapati Amit Dhurandhar Soumya Ghosh Soham Dan P. Sattigeri 89 3 0 21 Feb 2025
DH-RAG: A Dynamic Historical Context-Powered Retrieval-Augmented Generation Method for Multi-Turn Dialogue Feiyuan Zhang D. Zhu James Ming Yilun Jin Di Chai Liu Yang Han Tian Zhaoxin Fan Kai Chen 104 2 0 20 Feb 2025
Can Your Uncertainty Scores Detect Hallucinated Entity? Min-Hsuan Yeh Max Kamachee Seongheon Park Yixuan Li HILM 55 1 0 17 Feb 2025
On Memory Construction and Retrieval for Personalized Conversational Agents Zhuoshi Pan Qianhui Wu Huiqiang Jiang Xufang Luo Hao Cheng ... Yuqing Yang Chin-Yew Lin H. Vicky Zhao Lili Qiu Jianfeng Gao RALM 61 3 0 08 Feb 2025
Twilight: Adaptive Attention Sparsity with Hierarchical Top- $p$ Pruning C. Lin Jiaming Tang Shuo Yang Hanshuo Wang Tian Tang Boyu Tian Ion Stoica Enze Xie Mingyu Gao 97 2 0 04 Feb 2025
Parameters vs FLOPs: Scaling Laws for Optimal Sparsity for Mixture-of-Experts Language Models Samira Abnar Harshay Shah Dan Busbridge Alaaeldin Mohamed Elnouby Ali J. Susskind Vimal Thilak MoE LRM 41 5 0 28 Jan 2025
Wormhole Memory: A Rubik's Cube for Cross-Dialogue Retrieval Libo Wang 164 0 0 24 Jan 2025
Generative Adapter: Contextualizing Language Models in Parameters with A Single Forward Pass Tong Chen Hao Fang Patrick Xia Xiaodong Liu Benjamin Van Durme Luke Zettlemoyer Jianfeng Gao Hao Cheng KELM 56 2 0 08 Nov 2024
HART: Efficient Visual Generation with Hybrid Autoregressive Transformer Haotian Tang Yecheng Wu Shang Yang Enze Xie Junsong Chen Junyu Chen Zhuoyang Zhang Han Cai Yaojie Lu Song Han 74 34 0 14 Oct 2024
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners Yifei Gao Jie Ou Lei Wang Fanhua Shang Jaji Wu MQ 63 0 0 22 Jul 2024
Prompting Techniques for Secure Code Generation: A Systematic Investigation Catherine Tony Nicolás E. Díaz Ferreyra Markus Mutas Salem Dhiff Riccardo Scandariato SILM 79 9 0 09 Jul 2024
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph Roman Vashurin Ekaterina Fadeeva Artem Vazhentsev Akim Tsvigun Daniil Vasilev ... Timothy Baldwin Timothy Baldwin Maxim Panov Artem Shelmanov Artem Shelmanov HILM 68 10 0 21 Jun 2024
CSS: Contrastive Semantic Similarity for Uncertainty Quantification of LLMs Shuang Ao Stefan Rueger Advaith Siddharthan 33 1 0 05 Jun 2024
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models Yutao Zhu Zhaoheng Huang Zhicheng Dou Ji-Rong Wen RALM 56 5 0 30 May 2024
Conformal Alignment: Knowing When to Trust Foundation Models with Guarantees Yu Gui Ying Jin Zhimei Ren MedIm 40 18 0 16 May 2024
LFED: A Literary Fiction Evaluation Dataset for Large Language Models Linhao Yu Qun Liu Deyi Xiong 21 1 0 16 May 2024
Explainability for Transparent Conversational Information-Seeking Weronika Lajewska Damiano Spina Johanne Trippas K. Balog 42 7 0 06 May 2024
Efficient Data Generation for Source-grounded Information-seeking Dialogs: A Use Case for Meeting Transcripts Lotem Golany Filippo Galgani Maya Mamo Nimrod Parasol Omer Vandsburger Nadav Bar Ido Dagan 29 2 0 02 May 2024
PECC: Problem Extraction and Coding Challenges Patrick Haller Jonas Golde Alan Akbik ReLM 40 5 0 29 Apr 2024
TIGQA:An Expert Annotated Question Answering Dataset in Tigrinya Hailay Teklehaymanot Dren Fazlija Niloy Ganguly Gourab K. Patro Wolfgang Nejdl 36 0 0 26 Apr 2024
PerLTQA: A Personal Long-Term Memory Dataset for Memory Classification, Retrieval, and Synthesis in Question Answering Yiming Du Hongru Wang Zhengyi Zhao Bin Liang Baojun Wang Wanjun Zhong Zezhong Wang Kam-Fai Wong RALM 41 7 0 26 Feb 2024
Qsnail: A Questionnaire Dataset for Sequential Question Generation Yan Lei Liang Pang Yuanzhuo Wang Huawei Shen Xueqi Cheng 35 0 0 22 Feb 2024
Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models Jiahao Ying Yixin Cao Yushi Bai Qianru Sun Bo Wang Wei Tang Zhaojun Ding Yizhe Yang Xuanjing Huang Shuicheng Yan KELM 26 6 0 19 Feb 2024
Desiderata for the Context Use of Question Answering Systems Sagi Shaier Lawrence E Hunter K. Wense 28 4 0 31 Jan 2024
YTCommentQA: Video Question Answerability in Instructional Videos Saelyne Yang Sunghyun Park Yunseok Jang Moontae Lee 31 3 0 30 Jan 2024
Self-Supervised Position Debiasing for Large Language Models Zhongkun Liu Zheng Chen Mengqi Zhang Zhaochun Ren Pengjie Ren Zhumin Chen 36 1 0 02 Jan 2024
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws Nikhil Sardana Jacob P. Portes Sasha Doubov Jonathan Frankle LRM 248 73 0 31 Dec 2023
PCoQA: Persian Conversational Question Answering Dataset Hamed Hematian Hemati Atousa Toghyani Atena Souri Sayed Hesam Alavian Hossein Sameti Hamid Beigy 27 3 0 07 Dec 2023
InCA: Rethinking In-Car Conversational System Assessment Leveraging Large Language Models Ken E. Friedl Abbas Goher Khan S. Sahoo Md. Rony Jana Germies Christian Süß 32 3 0 13 Nov 2023
Interpreting Indirect Answers to Yes-No Questions in Multiple Languages Zijie Wang Md Mosharaf Hossain Shivam Mathur Terry Cruz Melo Kadir Bulut Ozler ... Jacob Quintero MohammadHossein Rezaei Shreya Nupur Shakya Md Nayem Uddin Eduardo Blanco 35 1 0 20 Oct 2023
AutoMix: Automatically Mixing Language Models Pranjal Aggarwal Aman Madaan Ankit Anand Srividya Pranavi Potharaju Swaroop Mishra ... Karthik Kappaganthu Yiming Yang Shyam Upadhyay Manaal Faruqui Mausam 42 19 0 19 Oct 2023
GLS-CSC: A Simple but Effective Strategy to Mitigate Chinese STM Models' Over-Reliance on Superficial Clue Yanrui Du Sendong Zhao Yuhan Chen Rai Bai Jing Liu Huaqin Wu Haifeng Wang Bing Qin 48 2 0 08 Sep 2023