Mamba: Linear-Time Sequence Modeling with Selective State Spaces

1 December 2023

Papers citing "Mamba: Linear-Time Sequence Modeling with Selective State Spaces"

50 / 279 papers shown

Title
MambaIRv2: Attentive State Space Restoration Hang Guo Yong Guo Yaohua Zha Yulun Zhang Wenbo Li Tao Dai Shu-Tao Xia Yawei Li Mamba 143 17 0 22 Nov 2024
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality Sanghyeok Lee Joonmyung Choi Hyunwoo J. Kim 151 3 0 22 Nov 2024
Fast convolution algorithm for state space models Gregory Beylkin 109 1 0 22 Nov 2024
Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction Jordan Vice Naveed Akhtar Leonid Sigal Ajmal Mian Ajmal Mian DiffM 115 0 0 21 Nov 2024
Parameter Efficient Mamba Tuning via Projector-targeted Diagonal-centric Linear Transformation Seokil Ham H. Kim Sangmin Woo Changick Kim Mamba 414 0 0 21 Nov 2024
Unsupervised Foundation Model-Agnostic Slide-Level Representation Learning Tim Lenz Peter Neidlinger M. Ligero Georg Wolflein M. Treeck Jakob Nikolas Kather 105 2 0 20 Nov 2024
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues Riccardo Grazzi Julien N. Siems Jörg Franke Arber Zela Frank Hutter Massimiliano Pontil 121 16 0 19 Nov 2024
KAN-Mamba FusionNet: Redefining Medical Image Segmentation with Non-Linear Modeling Akansh Agrawal Akshan Agrawal Shashwat Gupta Priyanka Bagade Mamba 115 3 0 18 Nov 2024
Breaking the Low-Rank Dilemma of Linear Attention Qihang Fan Huaibo Huang Ran He 78 1 0 12 Nov 2024
KMM: Key Frame Mask Mamba for Extended Motion Generation Zeyu Zhang Hang Gao Akide Liu Qi Chen Feng Chen ... Hao Tang Zhenming Li Zhongwen Zhou Hao Tang Bohan Zhuang Mamba VGen 76 3 0 10 Nov 2024
MambaPEFT: Exploring Parameter-Efficient Fine-Tuning for Mamba Masakazu Yoshimura Teruaki Hayashi Yota Maeda Mamba 177 2 0 06 Nov 2024
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation Hao Phung Quan Dao T. Dao Hoang Phan Dimitris Metaxas Anh Tran Mamba 96 4 0 06 Nov 2024
Layer-Adaptive State Pruning for Deep State Space Models Minseon Gwak Seongrok Moon Joohwan Ko PooGyeon Park 80 0 0 05 Nov 2024
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal Xiujin Zhu Chee-Onn Chow Joon Huang Chuah Mamba 62 0 0 05 Nov 2024
SPARC: Spectral Architectures Tackling the Cold-Start Problem in Graph Learning Yahel Jacobs Reut Dayan Uri Shaham 128 0 0 03 Nov 2024
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters Haiyang Wang Yue Fan Muhammad Ferjad Naeem Yongqin Xian J. E. Lenssen Liwei Wang F. Tombari Bernt Schiele 69 2 0 30 Oct 2024
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter Günter Klambauer Razvan Pascanu Sepp Hochreiter 172 5 0 29 Oct 2024
FACTS: A Factored State-Space Framework For World Modelling Li Nanbo Firas Laakom Yucheng Xu Wenyi Wang Jürgen Schmidhuber AI4TS 411 0 0 28 Oct 2024
MrT5: Dynamic Token Merging for Efficient Byte-level Language Models Julie Kallini Shikhar Murty Christopher D. Manning Christopher Potts Róbert Csordás 61 3 0 28 Oct 2024
Mixture of Parrots: Experts improve memorization more than reasoning Samy Jelassi Clara Mohri David Brandfonbrener Alex Gu Nikhil Vyas Nikhil Anand David Alvarez-Melis Yuanzhi Li Sham Kakade Eran Malach MoE 60 4 0 24 Oct 2024
Bio2Token: All-atom tokenization of any biomolecular structure with Mamba Andrew Liu Axel Elaldi Nathan Russell Olivia Viessmann Mamba 81 3 0 24 Oct 2024
Scaling Diffusion Language Models via Adaptation from Autoregressive Models Shansan Gong Shivam Agarwal Yizhe Zhang Jiacheng Ye Lin Zheng ... Peilin Zhao W. Bi Jiawei Han Hao Peng Dianbo Sui AI4CE 96 24 0 23 Oct 2024
MiniPLM: Knowledge Distillation for Pre-Training Language Models Yuxian Gu Hao Zhou Fandong Meng Jie Zhou Minlie Huang 122 5 0 22 Oct 2024
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination Jerry Huang Prasanna Parthasarathi Mehdi Rezagholizadeh Boxing Chen Sarath Chandar 103 0 0 22 Oct 2024
Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion Chaodong Xiao Minghan Li Zhengqiang Zhang Deyu Meng Lei Zhang Mamba 113 5 0 19 Oct 2024
In-context learning and Occam's razor Eric Elmoznino Tom Marty Tejas Kasetty Léo Gagnon Sarthak Mittal Mahan Fathi Dhanya Sridhar Guillaume Lajoie 78 1 0 17 Oct 2024
The Mystery of the Pathological Path-star Task for Language Models Arvid Frydenlund LRM 43 4 0 17 Oct 2024
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs Yizhao Gao Zhichen Zeng Dayou Du Shijie Cao Hayden Kwok-Hay So ... Junjie Lai Mao Yang Ting Cao Fan Yang M. Yang 84 20 0 17 Oct 2024
AI-Aided Kalman Filters Nir Shlezinger Guy Revach Anubhab Ghosh Saikat Chatterjee Shuo Tang Tales Imbiriba J. Duník O. Straka Pau Closas Yonina C. Eldar 112 5 0 16 Oct 2024
CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching Xingjian Wu Xiangfei Qiu Zhengyu Li Yihang Wang Jilin Hu Chenjuan Guo Hui Xiong Bin Yang AI4TS 89 14 0 16 Oct 2024
MambaBEV: An efficient 3D detection model with Mamba2 Zihan You Hao Wang Qichao Zhao Jinxiang Wang Jinxiang Wang Mamba 84 4 0 16 Oct 2024
State-space models can learn in-context by gradient descent Neeraj Mohan Sushma Yudou Tian Harshvardhan Mestha Nicolo Colombo David Kappel Anand Subramoney 83 3 0 15 Oct 2024
Geometric Inductive Biases of Deep Networks: The Role of Data and Architecture Sajad Movahedi Antonio Orvieto Seyed-Mohsen Moosavi-Dezfooli AI4CE AAML 423 0 0 15 Oct 2024
ControlMM: Controllable Masked Motion Generation Ekkasit Pinyoanuntapong Muhammad Usama Saleem Korrawe Karunratanakul Pu Wang Hongfei Xue Chong Chen Chuan Guo Junli Cao J. Ren Sergey Tulyakov VGen 53 7 0 14 Oct 2024
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning Sjoerd Groot Qinyu Chen Jan C. van Gemert Chang Gao Mamba 358 0 0 14 Oct 2024
Lambda-Skip Connections: the architectural component that prevents Rank Collapse Federico Arangath Joseph Jerome Sieber Melanie Zeilinger Carmen Amo Alonso 118 0 0 14 Oct 2024
HSR-Enhanced Sparse Attention Acceleration Bo Chen Yingyu Liang Zhizhou Sha Zhenmei Shi Zhao Song 142 20 0 14 Oct 2024
TULIP: Token-length Upgraded CLIP Ivona Najdenkoska Mohammad Mahdi Derakhshani Yuki M. Asano Nanne van Noord Marcel Worring Cees G. M. Snoek VLM 80 4 0 13 Oct 2024
ELICIT: LLM Augmentation via External In-Context Capability Futing Wang Jianhao Yan Yue Zhang Tao Lin 80 0 0 12 Oct 2024
Parameter-Efficient Fine-Tuning of State Space Models Kevin Galim Wonjun Kang Yuchen Zeng H. Koo Kangwook Lee 75 4 0 11 Oct 2024
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation Jiatao Gu Yuyang Wang Yizhe Zhang Qihang Zhang Dinghuai Zhang Navdeep Jaitly Josh Susskind Shuangfei Zhai DiffM 73 14 0 10 Oct 2024
Detecting Training Data of Large Language Models via Expectation Maximization Gyuwan Kim Yang Li Evangelia Spiliopoulou Jie Ma Miguel Ballesteros William Yang Wang MIALM 150 4 2 10 Oct 2024
Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity Mutian He Philip N. Garner 124 0 0 09 Oct 2024
Amortized Control of Continuous State Space Feynman-Kac Model for Irregular Time Series Byoungwoo Park Hyungi Lee Juho Lee AI4TS 101 0 0 08 Oct 2024
Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective Jinhao Li Jiaming Xu Shan Huang Yonghua Chen Wen Li ... Jiayi Pan Li Ding Hao Zhou Yu Wang Guohao Dai 89 18 0 06 Oct 2024
LoRTA: Low Rank Tensor Adaptation of Large Language Models Ignacio Hounie Charilaos I. Kanatsoulis Arnuv Tandon Alejandro Ribeiro 97 0 0 05 Oct 2024
Fundamental Limitations on Subquadratic Alternatives to Transformers Josh Alman Hantao Yu 48 2 0 05 Oct 2024
Oscillatory State-Space Models T. Konstantin Rusch Daniela Rus AI4TS 317 7 0 04 Oct 2024
EBES: Easy Benchmarking for Event Sequences Dmitry Osin Igor Udovichenko Viktor Moskvoretskii Egor Shvetsov Evgeny Burnaev 117 1 0 04 Oct 2024
HMT-Grasp: A Hybrid Mamba-Transformer Approach for Robot Grasping in Cluttered Environments Songsong Xiong Hamidreza Kasaei 59 1 0 04 Oct 2024