Title
rPPG-SysDiaGAN: Systolic-Diastolic Feature Localization in rPPG Using Generative Adversarial Network with Multi-Domain Discriminator Banafsheh Adami Nima Karimian 82 1 0 01 Apr 2025
GRU-AUNet: A Domain Adaptation Framework for Contactless Fingerprint Presentation Attack Detection Banafsheh Adami Nima Karimian 68 0 0 01 Apr 2025
LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification Xiang Hu Yuhao Wang Pingping Zhang Huchuan Lu VLM 133 0 0 31 Mar 2025
Efficient Token Compression for Vision Transformer with Spatial Information Preserved Junzhu Mao Yang Shen Jinyang Guo Yazhou Yao Xiansheng Hua ViT 141 0 0 30 Mar 2025
Data-driven Mesoscale Weather Forecasting Combining Swin-Unet and Diffusion Models Yuta Hirabayashi Daisuke Matsuoka DiffM 70 0 0 25 Mar 2025
FuXi-RTM: A Physics-Guided Prediction Framework with Radiative Transfer Modeling Qiusheng Huang Xiaohui Zhong Xu Fan Lei Chen Hao Li AI4TS AI4CE 89 0 0 25 Mar 2025
CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation Jungsoo Lee Debasmit Das Munawar Hayat Sungha Choi Kyuwoong Hwang Fatih Porikli VLM 110 1 0 23 Mar 2025
Fractal-IR: A Unified Framework for Efficient and Scalable Image Restoration Yawei Li Bin Ren Christos Sakaridis Rakesh Ranjan Mengyuan Liu N. Sebe Ming-Hsuan Yang Luca Benini 101 0 0 22 Mar 2025
Beyond Accuracy: What Matters in Designing Well-Behaved Models? Robin Hesse Doğukan Bağcı Bernt Schiele Simone Schaub-Meyer Stefan Roth VLM 112 0 0 21 Mar 2025
From Head to Tail: Efficient Black-box Model Inversion Attack via Long-tailed Learning Ziang Li Hongguang Zhang Juan Wang Meihui Chen Hongxin Hu Wenzhe Yi Xiaoyang Xu Mengda Yang Chenjun Ma 144 0 0 20 Mar 2025
LIFT: Latent Implicit Functions for Task- and Data-Agnostic Encoding Amirhossein Kazerouni Soroush Mehraban Michael Brudno Babak Taati 90 2 0 19 Mar 2025
Towards Scalable Modeling of Compressed Videos for Efficient Action Recognition Shristi Das Biswas Efstathia Soufleri Arani Roy Kaushik Roy 116 0 0 17 Mar 2025
MEET: A Million-Scale Dataset for Fine-Grained Geospatial Scene Classification with Zoom-Free Remote Sensing Imagery Yansheng Li Yuning Wu Gong Cheng Chao Tao Bo Dang ... Chuxu Zhang Yang Liu Xianfeng Tang Jiayi Ma Yongjun Zhang 90 3 0 14 Mar 2025
HeightFormer: Learning Height Prediction in Voxel Features for Roadside Vision Centric 3D Object Detection via Transformer Zhang Zhang Chao Sun Chao Yue Da Wen Yujie Chen Tianze Wang Jianghao Leng ViT 88 1 0 13 Mar 2025
Dynamic Dictionary Learning for Remote Sensing Image Segmentation Xuechao Zou Yue Li Shun Zhang Kai Li Shiying Wang Pin Tao Junliang Xing Congyan Lang 90 0 0 09 Mar 2025
FEDS: Feature and Entropy-Based Distillation Strategy for Efficient Learned Image Compression H. Fu Jie Liang Zhenman Fang Jingning Han 135 0 0 09 Mar 2025
Viewport-Unaware Blind Omnidirectional Image Quality Assessment: A Flexible and Effective Paradigm Jiebin Yan Kangcheng Wu Junjie Chen Ziwen Tan Yuming Fang 115 1 0 08 Mar 2025
DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation Runze Zhang Guoguang Du Xiaochuan Li Qi Jia Liang Jin ... Zhenhua Guo Yaqian Zhao Xiaoli Gong Rengang Li Baoyu Fan VGen 122 2 0 08 Mar 2025
EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images Rohit Menon Nils Dengler Sicong Pan Gokul Krishna Chenchani Maren Bennewitz EDL 134 0 0 06 Mar 2025
Computational Analysis of Degradation Modeling in Blind Panoramic Image Quality Assessment Jiebin Yan Ziwen Tan Jiale Rao Lei Wu Yifan Zuo Yuming Fang 100 0 0 05 Mar 2025
Task-Agnostic Attacks Against Vision Foundation Models Brian Pulfer Yury Belousov Vitaliy Kinakh Teddy Furon S. Voloshynovskiy AAML 109 0 0 05 Mar 2025
Adaptive Camera Sensor for Vision Models Eunsu Baek Sunghwan Han Taesik Gong Hyung-Sin Kim VLM Presented at ResearchTrend Connect \| VLM on 28 Mar 2025 218 0 0 04 Mar 2025
Enhancing Retinal Vessel Segmentation Generalization via Layout-Aware Generative Modelling Jonathan Fhima Jan Van Eijgen Lennert Beeckmans Thomas Jacobs Moti Freiman Luis Filipe Nakayama Ingeborg Stalmans Chaim Baskin Joachim A. Behar MedIm 176 0 0 03 Mar 2025
SAR-W-MixMAE: SAR Foundation Model Training Using Backscatter Power Weighting Ali Caglayan Nevrez Imamoglu T. Kouyama 148 0 0 03 Mar 2025
FLStore: Efficient Federated Learning Storage for non-training workloads Ahmad Faraz Khan Samuel Fountain Ahmed M. Abdelmoniem A. R. Butt A. Anwar FedML 114 0 0 01 Mar 2025
Investigating the contribution of terrain-following coordinates and conservation schemes in AI-driven precipitation forecasts Yingkai Sha John S. Schreck William E. Chapman David John Gagne II 74 1 0 01 Mar 2025
Robust and Efficient Writer-Independent IMU-Based Handwriting Recognization Jindong Li Tim Hamann Jens Barth Peter Kaempf Dario Zanca Bjoern M. Eskofier 55 0 0 28 Feb 2025
Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions Palawat Busaranuvong Emmanuel O. Agu Reza Saadati Fard Deepak Kumar Shefalika Gautam B. Tulu Diane Strong MedIm 138 0 0 27 Feb 2025
GONet: A Generalizable Deep Learning Model for Glaucoma Detection Or Abramovich Hadas Pizem Jonathan Fhima Eran Berkowitz Ben Gofrit ... Meital Baskin Jan Van Eijgen Ingeborg Stalmans E. Blumenthal Joachim A. Behar 76 2 0 26 Feb 2025
MVIP -- A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition Paul Koch Marian Schluter Jörg Krüger 142 0 0 24 Feb 2025
MaxGlaViT: A novel lightweight vision transformer-based approach for early diagnosis of glaucoma stages from fundus images Mustafa Yurdakul Kubra Uyar Şakir Tasdemir 129 1 0 24 Feb 2025
MEX: Memory-efficient Approach to Referring Multi-Object Tracking Huu-Thien Tran Phuoc-Sang Pham Thai-Son Tran Khoa Luu VOT 160 1 0 20 Feb 2025
Precise GPS-Denied UAV Self-Positioning via Context-Enhanced Cross-View Geo-Localization Yuanze Xu Ming Dai Wenxiao Cai Wankou Yang 104 0 0 17 Feb 2025
Without Paired Labeled Data: End-to-End Self-Supervised Learning for Drone-view Geo-Localization Zhongwei Chen Zhao-Xu Yang Hai-Jun Rong SSL 130 0 0 17 Feb 2025
Amnesia as a Catalyst for Enhancing Black Box Pixel Attacks in Image Classification and Object Detection Dongsu Song Daehwa Ko Jay Hoon Jung AAML 100 0 0 10 Feb 2025
Integrating Sequence and Image Modeling in Irregular Medical Time Series Through Self-Supervised Learning Liuqing Chen Shuhong Xiao Shixian Ding Shanhai Hu Lingyun Sun 137 0 0 10 Feb 2025
Learning Musical Representations for Music Performance Question Answering Xingjian Diao Chunhui Zhang Tingxuan Wu Ming Cheng Z. Ouyang Weiyi Wu Jiang Gui 121 12 0 10 Feb 2025
Invizo: Arabic Handwritten Document Optical Character Recognition Solution Alhossien Waly Bassant Tarek Ali Feteha Rewan Yehia Gasser Amr Walid Gomaa Ahmed M. Fares 146 0 0 07 Feb 2025
Addressing Out-of-Label Hazard Detection in Dashcam Videos: Insights from the COOOL Challenge Anh-Kiet Duong Petra Gomez-Krämer 131 2 0 27 Jan 2025
A margin-based replacement for cross-entropy loss Michael W. Spratling Heiko H. Schütt 158 0 0 21 Jan 2025
A Survey on Memory-Efficient Large-Scale Model Training in AI for Science Kaiyuan Tian Linbo Qiao Baihui Liu Gongqingjian Jiang Dongsheng Li 98 0 0 21 Jan 2025
DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains Junyu Xia Jiesong Bai Yihang Dong ViT 246 0 0 21 Jan 2025
A Remote Sensing Image Change Detection Method Integrating Layer Exchange and Channel-Spatial Differences Sijun Dong Fangcheng Zuo Geng Chen Siming Fu Xiaoliang Meng 51 0 0 19 Jan 2025
Keypoint Aware Masked Image Modelling Madhava Krishna Convin.AI 124 0 0 03 Jan 2025
VMamba: Visual State Space Model Yue Liu Yunjie Tian Yuzhong Zhao Hongtian Yu Lingxi Xie Yaowei Wang Qixiang Ye Jianbin Jiao Yunfan Liu Mamba 314 722 0 31 Dec 2024
Adaptive Dataset Quantization Muquan Li Dongyang Zhang Qiang Dong Xiurui Xie Ke Qin DD MQ 132 0 0 22 Dec 2024
MAGIC++: Efficient and Resilient Modality-Agnostic Semantic Segmentation via Hierarchical Modality Selection Xu Zheng Yuanhuiyi Lyu Lutao Jiang Jiazhou Zhou Lin Wang Xuming Hu 140 8 0 22 Dec 2024
V"Mean"ba: Visual State Space Models only need 1 hidden dimension Tien-Yu Chi Hung-Yueh Chiang Chi-Chih Chang N. Huang Kai-Chiang Wu 132 0 0 21 Dec 2024
Safety Monitoring of Machine Learning Perception Functions: a Survey Raul Sena Ferreira Joris Guérin Kevin Delmas Jérémie Guiochet H. Waeselynck 121 0 0 09 Dec 2024
Gesture Classification in Artworks Using Contextual Image Features Azhar Hussian Mathias Zinnen Thi My Hang Tran Andreas Maier Vincent Christlein 119 0 0 04 Dec 2024