PipeRAG: Fast Retrieval-Augmented Generation via Algorithm-System
Co-design

PipeRAG: Fast Retrieval-Augmented Generation via Algorithm-System Co-design

8 March 2024

Tim Kraska

Papers citing "PipeRAG: Fast Retrieval-Augmented Generation via Algorithm-System Co-design"

8 / 8 papers shown

Title
Taming the Titans: A Survey of Efficient LLM Inference Serving Ranran Zhen J. Li Yixin Ji Zhengyuan Yang Tong Liu Qingrong Xia Xinyu Duan Zehao Wang Baoxing Huai Hao Fei LLMAG 77 0 0 28 Apr 2025
RAGO: Systematic Performance Optimization for Retrieval-Augmented Generation Serving Wenqi Jiang Suvinay Subramanian Cat Graves Gustavo Alonso Amir Yazdanbakhsh Vidushi Dadu 49 6 0 18 Mar 2025
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models Qinggang Zhang Shengyuan Chen Yuanchen Bei Zheng Yuan Huachi Zhou Zijin Hong Junnan Dong Hao-Heng Chen Yi-Ju Chang Xiao Huang 3DV 73 8 0 21 Jan 2025
TurboRAG: Accelerating Retrieval-Augmented Generation with Precomputed KV Caches for Chunked Text Songshuo Lu Hua Wang Yutian Rong Zhi Chen Yaohua Tang VLM 31 16 0 10 Oct 2024
RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation Chao Jin Zili Zhang Xuanlin Jiang Fangyue Liu Xin Liu Xuanzhe Liu Xin Jin 42 41 0 18 Apr 2024
Chameleon: a Heterogeneous and Disaggregated Accelerator System for Retrieval-Augmented Language Models Wenqi Jiang Marco Zeller R. Waleffe Torsten Hoefler Gustavo Alonso 54 16 0 15 Oct 2023
Co-design Hardware and Algorithm for Vector Search Wenqi Jiang Shigang Li Yu Zhu Johannes de Fine Licht Zhenhao He ... Cédric Renggli Shuai Zhang Theodoros Rekatsinas Torsten Hoefler Gustavo Alonso 84 20 0 19 Jun 2023
Internet-Augmented Dialogue Generation M. Komeili Kurt Shuster Jason Weston RALM 244 281 0 15 Jul 2021