Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps

2 November 2020

Papers citing "Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps"

50 / 101 papers shown

Title
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models Tanmay Parekh Pradyot Prakash Alexander Radovic Akshay Shekher Denis Savenkov LRM 145 1 0 30 Oct 2024
Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval Ingeol Baek Hwan Chang Byeongjeong Kim Jimin Lee Hwanhee Lee RALM 65 4 0 17 Oct 2024
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering Zhongwu Chen Chengjin Xu Dingmin Wang Zhen Huang Yong Dou Xuhui Jiang Jian Guo RALM 251 1 0 15 Oct 2024
Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context Sangwon Yu Ik-hwan Kim Jongyoon Song Saehyung Lee Junsung Park Sungroh Yoon LRM 72 0 0 09 Oct 2024
Differential Transformer Tianzhu Ye Li Dong Yuqing Xia Yutao Sun Yi Zhu Gao Huang Furu Wei 239 0 0 07 Oct 2024
Attention in Large Language Models Yields Efficient Zero-Shot Re-Rankers Shijie Chen Bernal Jiménez Gutiérrez Yu Su 38 4 0 03 Oct 2024
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding Yanming Liu Xinyue Peng Jiannan Cao Shi Bo Yanxin Shen Tianyu Du Sheng Cheng Xun Wang Jianwei Yin Xuhong Zhang 71 9 0 02 Oct 2024
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely Siyun Zhao Yuqing Yang Zilong Wang Zhiyuan He Luna Qiu Lili Qiu SyDa RALM 3DV 51 36 0 23 Sep 2024
Co-occurrence is not Factual Association in Language Models Xiao Zhang Miao Li Ji Wu KELM 75 2 0 21 Sep 2024
What are the Essential Factors in Crafting Effective Long Context Multi-Hop Instruction Datasets? Insights and Best Practices Zhi Chen Qiguang Chen Libo Qin Qipeng Guo Haijun Lv Yicheng Zou Wanxiang Che Hang Yan K. Chen Dahua Lin SyDa 56 4 0 03 Sep 2024
RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework Kunlun Zhu Yifan Luo Dingling Xu Ruobing Wang Shi Yu ... Yishan Li Zhiyuan Liu Xu Han Zhiyuan Liu Maosong Sun 36 17 0 02 Aug 2024
Retrieve, Summarize, Plan: Advancing Multi-hop Question Answering with an Iterative Approach Zhouyu Jiang Mengshu Sun Lei Liang Qing Cui RALM 80 12 0 18 Jul 2024
PlanRAG: A Plan-then-Retrieval Augmented Generation for Generative Large Language Models as Decision Makers Myeonghwa Lee Seonho An Min-Soo Kim 3DV RALM 44 18 0 18 Jun 2024
Refiner: Restructure Retrieval Content Efficiently to Advance Question-Answering Capabilities Zhonghao Li Xuming Hu Aiwei Liu Kening Zheng Shijie Huang Hui Xiong RALM 115 8 0 17 Jun 2024
An Empirical Study of Mamba-based Language Models R. Waleffe Wonmin Byeon Duncan Riach Brandon Norick V. Korthikanti ... Vartika Singh Jared Casper Jan Kautz M. Shoeybi Bryan Catanzaro 63 66 0 12 Jun 2024
DR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-Answering Zijian Hei Weiling Liu Wenjie Ou Juyi Qiao Junming Jiao Guowen Song Ting Tian Yi Lin RALM 46 5 0 11 Jun 2024
Chain of Agents: Large Language Models Collaborating on Long-Context Tasks Yusen Zhang Ruoxi Sun Yanfei Chen Tomas Pfister Rui Zhang Sercan Ö. Arik RALM AI4CE LLMAG 59 30 0 04 Jun 2024
ACCORD: Closing the Commonsense Measurability Gap François Roewer-Després Jinyue Feng Zining Zhu Frank Rudzicz LRM 50 0 0 04 Jun 2024
PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling Zefan Cai Yichi Zhang Bofei Gao Yuliang Liu Yong Li ... Wayne Xiong Yue Dong Baobao Chang Junjie Hu Wen Xiao 75 86 0 04 Jun 2024
Graph Neural Network Enhanced Retrieval for Question Answering of LLMs Zijian Li Qingyan Guo Jiawei Shao Lei Song Jiang Bian Jun Zhang Rui Wang RALM 39 11 0 03 Jun 2024
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models Yutao Zhu Zhaoheng Huang Zhicheng Dou Ji-Rong Wen RALM 56 5 0 30 May 2024
CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion Jiayi Yao Hanchen Li Yuhan Liu Siddhant Ray Yihua Cheng Qizheng Zhang Kuntai Du Shan Lu Junchen Jiang 44 16 0 26 May 2024
HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models Bernal Jiménez Gutiérrez Yiheng Shu Yu Gu Michihiro Yasunaga Yu-Chuan Su RALM CLL 68 33 0 23 May 2024
FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research Jiajie Jin Yutao Zhu Xinyu Yang Chenghao Zhang Zhicheng Dou Chenghao Zhang Tong Zhao Zhao Yang Zhicheng Dou Ji-Rong Wen VLM 85 54 0 22 May 2024
CORM: Cache Optimization with Recent Message for Large Language Model Inference Jincheng Dai Zhuowei Huang Haiyun Jiang Chen Chen Deng Cai Wei Bi Shuming Shi 38 3 0 24 Apr 2024
Tree of Reviews: A Tree-based Dynamic Iterative Retrieval Framework for Multi-hop Question Answering Jiapeng Li Runze Liu Yabo Liu Tong Zhou Mingling Li Xiang Chen LRM 49 3 0 22 Apr 2024
FanOutQA: A Multi-Hop, Multi-Document Question Answering Benchmark for Large Language Models Andrew Zhu Alyssa Hwang Liam Dugan Chris Callison-Burch ELM 50 0 0 21 Feb 2024
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language Models Gains More Yuxuan Yue Zhihang Yuan Haojie Duanmu Sifan Zhou Jianlong Wu Liqiang Nie MQ 40 42 0 19 Feb 2024
Can We Verify Step by Step for Incorrect Answer Detection? Xin Xu Shizhe Diao Can Yang Yang Wang LRM 130 14 0 16 Feb 2024
Demystifying Chains, Trees, and Graphs of Thoughts Maciej Besta Florim Memedi Zhenyu Zhang Robert Gerstenberger Guangyuan Piao ... Aleš Kubíček H. Niewiadomski Aidan O'Mahony Onur Mutlu Torsten Hoefler AI4CE LRM 75 27 0 25 Jan 2024
Towards Verifiable Text Generation with Evolving Memory and Self-Reflection Hao Sun Hengyi Cai Bo Wang Yingyan Hou Xiaochi Wei Shuaiqiang Wang Yan Zhang Dawei Yin 51 9 0 14 Dec 2023
Learning to Break: Knowledge-Enhanced Reasoning in Multi-Agent Debate System Haotian Wang Xiyuan Du Weijiang Yu Qianglong Chen Kun Zhu Zheng Chu Lian Yan Yi Guan 34 10 0 08 Dec 2023
Uncertainty Guided Global Memory Improves Multi-Hop Question Answering Alsu Sagirova Andrey Kravchenko RALM 30 1 0 29 Nov 2023
Probabilistic Tree-of-thought Reasoning for Answering Knowledge-intensive Complex Questions S. Cao Jiajie Zhang Jiaxin Shi Xin Lv Zijun Yao Qingwen Tian Juanzi Li Lei Hou LRM 29 14 0 23 Nov 2023
Prompt Cache: Modular Attention Reuse for Low-Latency Inference In Gim Guojun Chen Seung-seob Lee Nikhil Sarda Anurag Khandelwal Lin Zhong 42 77 0 07 Nov 2023
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text Wenting Zhao Ye Liu Tong Niu Yao Wan Philip S. Yu Chenyu You Yingbo Zhou Semih Yavuz LRM 27 6 0 31 Oct 2023
Performance Prediction for Multi-hop Questions M. Samadi Davood Rafiei 30 3 0 12 Aug 2023
Active Retrieval Augmented Generation Zhengbao Jiang Frank F. Xu Luyu Gao Zhiqing Sun Qian Liu Jane Dwivedi-Yu Yiming Yang Jamie Callan Graham Neubig RALM 30 256 0 11 May 2023
Natural Language Reasoning, A Survey Fei Yu Hongbo Zhang Prayag Tiwari Benyou Wang ReLM LRM 54 54 0 26 Mar 2023
Analyzing the Effectiveness of the Underlying Reasoning Tasks in Multi-hop Question Answering Xanh Ho A. Nguyen Saku Sugawara Akiko Aizawa LRM 49 7 0 12 Feb 2023
Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions H. Trivedi Niranjan Balasubramanian Tushar Khot Ashish Sabharwal KELM RALM LRM 44 390 0 20 Dec 2022
How Well Do Multi-hop Reading Comprehension Models Understand Date Information? Xanh Ho Saku Sugawara Akiko Aizawa 39 2 0 11 Oct 2022
Measuring and Narrowing the Compositionality Gap in Language Models Ofir Press Muru Zhang Sewon Min Ludwig Schmidt Noah A. Smith M. Lewis ReLM KELM LRM 57 565 0 07 Oct 2022
Decomposed Prompting: A Modular Approach for Solving Complex Tasks Tushar Khot H. Trivedi Matthew Finlayson Yao Fu Kyle Richardson Peter Clark Ashish Sabharwal ReLM LRM 70 422 0 05 Oct 2022
A Survey on Measuring and Mitigating Reasoning Shortcuts in Machine Reading Comprehension Xanh Ho Johannes Mario Meissner Saku Sugawara Akiko Aizawa OffRL 45 4 0 05 Sep 2022
Iteratively Prompt Pre-trained Language Models for Chain of Thought Boshi Wang Xiang Deng Huan Sun KELM ReLM LRM 44 95 0 16 Mar 2022
Reasoning over Public and Private Data in Retrieval-Based Systems Simran Arora Patrick Lewis Angela Fan Jacob Kahn Christopher Ré 28 23 0 14 Mar 2022
Hey AI, Can You Solve Complex Tasks by Talking to Agents? Tushar Khot Kyle Richardson Daniel Khashabi Ashish Sabharwal RALM LRM 20 14 0 16 Oct 2021
More Than Reading Comprehension: A Survey on Datasets and Metrics of Textual Question Answering Yang Bai D. Wang 96 10 0 25 Sep 2021
MuSiQue: Multihop Questions via Single-hop Question Composition H. Trivedi Niranjan Balasubramanian Tushar Khot Ashish Sabharwal LRM 32 232 0 02 Aug 2021