Title
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving Xiangchen Li Dimitrios Spatharakis Saeid Ghafouri Jiakun Fan Dimitrios Nikolopoulos Deepu John Bo Ji Dimitrios S. Nikolopoulos 52 0 0 11 Jun 2025
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding Jian Chen Vashisth Tiwari Ranajoy Sadhukhan Zhuoming Chen Jinyuan Shi Ian En-Hsu Yen Ian En-Hsu Yen Avner May Tianqi Chen Beidi Chen LRM 154 32 0 20 Aug 2024