Title
PromptTSS: A Prompting-Based Approach for Interactive Multi-Granularity Time Series Segmentation Ching Chang Ming-Chih Lo Wen-Chih Peng Tien-Fu Chen AI4TS 54 0 0 12 Jun 2025
Semantic-decoupled Spatial Partition Guided Point-supervised Oriented Object Detection Xinyuan Liu Hang Xu Yike Ma Yucheng Zhang Feng Dai 116 0 0 12 Jun 2025
PyLO: Towards Accessible Learned Optimizers in PyTorch Paul Janson Benjamin Thérien Quentin G. Anthony Xiaolong Huang A. Moudgil Eugene Belilovsky ODL AI4CE 152 0 0 12 Jun 2025
Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation Siyu Chen Ting Han Chengzheng Fu Changshe Zhang Chaolei Wang Jinhe Su Guorong Cai Meiliu Wu ObjD VLM 105 0 0 11 Jun 2025
DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos C. Lin Zhaoyang Lv Songyin Wu Zhen Xu Thu Nguyen-Phuoc ... Ming-Hsuan Yang Yuheng Ren Richard Newcombe Zhao Dong Zhengqin Li 3DGS 77 0 0 11 Jun 2025
Vectorized Region Based Brush Strokes for Artistic Rendering Jeripothula Prudviraj Vikram Jamwal DiffM 74 0 0 11 Jun 2025
CHIP: A multi-sensor dataset for 6D pose estimation of chairs in industrial settings Mattia Nardon Mikel Mujika Agirre Ander González Tomé Daniel Sedano Algarabel Josep Rueda Collell Ana Paola Caro Andrea Caraffa Fabio Poiesi P. Chippendale Davide Boscaini 88 0 0 11 Jun 2025
ScaleLSD: Scalable Deep Line Segment Detection Streamlined Zeran Ke Bin Tan Xianwei Zheng Yujun Shen Tianfu Wu Nan Xue 80 0 0 11 Jun 2025
Self-Supervised Multi-Part Articulated Objects Modeling via Deformable Gaussian Splatting and Progressive Primitive Segmentation Haowen Wang Xiaoping Yuan Zhao Jin Zhen Zhao Zhengping Che Yousong Xue Jin Tian Yakun Huang Jian Tang 3DGS 99 0 0 11 Jun 2025
Efficient Part-level 3D Object Generation via Dual Volume Packing Jiaxiang Tang Ruijie Lu Zhaoshuo Li Zekun Hao Xuan Li Fangyin Wei Shuran Song Gang Zeng Ming-Yu Liu Tsung-Yi Lin OCL 105 0 0 11 Jun 2025
Accurate and efficient zero-shot 6D pose estimation with frozen foundation models Andrea Caraffa Davide Boscaini Fabio Poiesi 95 0 0 11 Jun 2025
Text-Aware Image Restoration with Diffusion Models Jaewon Min J. Kim Paul Hyunbin Cho J. Lee Jihye Park Minkyu Park S. Kim Hyunhee Park Seungryong Kim 76 0 0 11 Jun 2025
CheckManual: A New Challenge and Benchmark for Manual-based Appliance Manipulation Yuxing Long Jiyao Zhang Mingjie Pan Tianshu Wu Taewhan Kim Hao Dong 87 0 0 11 Jun 2025
Vision Generalist Model: A Survey Ziyi Wang Yongming Rao Shuofeng Sun Xinrun Liu Yi Wei ... Zuyan Liu Yanbo Wang Hongmin Liu Jie Zhou Jiwen Lu 78 0 0 11 Jun 2025
GLD-Road:A global-local decoding road network extraction model for remote sensing images Ligao Deng Yupeng Deng Yu Meng Jingbo Chen Zhihao Xi Diyou Liu Qifeng Chu 80 0 0 11 Jun 2025
JAFAR: Jack up Any Feature at Any Resolution Paul Couairon Loick Chambon Louis Serrano Jean-Emmanuel Haugeard Matthieu Cord Nicolas Thome MDE 51 0 0 10 Jun 2025
Segment This Thing: Foveated Tokenization for Efficient Point-Prompted Segmentation Tanner Schmidt Richard Newcombe VLM 34 0 0 10 Jun 2025
Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis Jingguo Qu Xinyang Han Tonghuan Xiao Jia Ai Juan Wu ... Jing Qin Ann Dorothy King Winnie Chiu-Wing Chu J. Cai Michael Tin-Cheung Ying MedIm 59 0 0 10 Jun 2025
Segment Concealed Objects with Incomplete Supervision Chunming He Kai Li Yachao Zhang Ziyun Yang Youwei Pang ... Chengyu Fang Yulun Zhang Linghe Kong Xiu Li Sina Farsiu 58 0 0 10 Jun 2025
AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models Zheda Mai A. Chowdhury Zihe Wang Sooyoung Jeon Jingyan Bai Jiacheng Hou Jihyung Kil Wei-Lun Chao CoGe 73 0 0 10 Jun 2025
Effective Data Pruning through Score Extrapolation Sebastian Schmidt Prasanga Dhungel Christoffer Löffler Bjorn Nieth Stephan Günnemann Leo Schwinn SyDa 57 0 0 10 Jun 2025
SAMSelect: A Spectral Index Search for Marine Debris Visualization using Segment Anything Joost van Dalen Yuki M. Asano Marc Russwurm 20 0 0 10 Jun 2025
Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces Kevin Rojas Yuchen Zhu Sichen Zhu Felix X.-F. Ye Molei Tao DiffM 36 0 0 09 Jun 2025
LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds Zihui Zhang Weisheng Dai Hongtao Wen Bo Yang 3DPC 32 0 0 09 Jun 2025
Consistent Video Editing as Flow-Driven Image-to-Video Generation Ge Wang Songlin Fan Hangxu Liu Quanjian Song Hewei Wang Jinfeng Xu DiffM VGen 35 0 0 09 Jun 2025
Image Reconstruction as a Tool for Feature Analysis Eduard Allakhverdov Dmitrii Tarasov Elizaveta Goncharova Andrey Kuznetsov 26 0 0 09 Jun 2025
OpenSplat3D: Open-Vocabulary 3D Instance Segmentation using Gaussian Splatting Jens Piekenbrinck Christian Schmidt Alexander Hermans Narunas Vaskevicius Timm Linder Bastian Leibe 3DGS VLM 23 0 0 09 Jun 2025
Synthetic Visual Genome J. S. Park Zixian Ma Linjie Li Chenhao Zheng Cheng-Yu Hsieh ... Quan Kong Norimasa Kobori Ali Farhadi Yejin Choi Ranjay Krishna 35 0 0 09 Jun 2025
Decoupling the Image Perception and Multimodal Reasoning for Reasoning Segmentation with Digital Twin Representations Yizhen Li Dell Zhang Xuelong Li Yiqing Shen VLM 32 0 0 09 Jun 2025
Adapter Naturally Serves as Decoupler for Cross-Domain Few-Shot Semantic Segmentation Jintao Tong Ran Ma Yonghong Tian Guangyao Chen Yuhua Li Ruixuan Li 23 0 0 09 Jun 2025
Design and Evaluation of Deep Learning-Based Dual-Spectrum Image Fusion Methods Beining Xu Junxian Li 29 0 0 09 Jun 2025
EgoM2P: Egocentric Multimodal Multitask Pretraining Gen Li Yutong Chen Yiqian Wu Kaifeng Zhao Marc Pollefeys Siyu Tang EgoV VLM 52 0 0 09 Jun 2025
Segment Any Architectural Facades (SAAF):An automatic segmentation model for building facades, walls and windows based on multimodal semantics guidance Peilin Li Jun Yin Jing Zhong Ran Luo Pengyu Zeng Miao Zhang 36 0 0 09 Jun 2025
Enhancing the Safety of Medical Vision-Language Models by Synthetic Demonstrations Zhiyu Xue Reza Abbasi-Asl Ramtin Pedarsani AAML 41 0 0 08 Jun 2025
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation Chao Yin Hao Li Kequan Yang Jide Li Pinpin Zhu Xiaoqiang Li 28 0 0 07 Jun 2025
Experimental Evaluation of Static Image Sub-Region-Based Search Models Using CLIP Bastian Jäckl Vojtěch Kloda Daniel A. Keim Jakub Lokoč 31 1 0 07 Jun 2025
Controllable Coupled Image Generation via Diffusion Models Chenfei Yuan Nanshan Jia Hangqi Li Peter W. Glynn Zeyu Zheng DiffM 38 0 0 07 Jun 2025
O-MaMa @ EgoExo4D Correspondence Challenge: Learning Object Mask Matching between Egocentric and Exocentric Views Lorenzo Mur-Labadia Maria Santos-Villafranca Alejandro Pérez-Yus J. Bermudez-Cameo Ruben Martinez-Cantin Jose J. Guerrero VLM 72 0 0 06 Jun 2025
AssetDropper: Asset Extraction via Diffusion Models with Reward-Driven Optimization Lanjiong Li Guanhua Zhao Lingting Zhu Zeyu Cai Lequan Yu Jian Zhang Zeyu Wang 37 0 0 06 Jun 2025
Dynamic Mixture of Progressive Parameter-Efficient Expert Library for Lifelong Robot Learning Yuheng Lei Sitong Mao Shunbo Zhou Hongyuan Zhang Xuelong Li Ping Luo CLL 58 0 0 06 Jun 2025
Cross-View Multi-Modal Segmentation @ Ego-Exo4D Challenges 2025 Yuqian Fu Runze Wang Yanwei Fu Danda Pani Paudel Luc Van Gool 64 0 0 06 Jun 2025
MapleGrasp: Mask-guided Feature Pooling for Language-driven Efficient Robotic Grasping V. Bhat Naman Patel Prashanth Krishnamurthy Ramesh Karri Farshad Khorrami 30 0 0 06 Jun 2025
Aerial Multi-View Stereo via Adaptive Depth Range Inference and Normal Cues Y. Liu Yakun Ju Yuan Rao Hao Fan Junyu Dong Feng Gao Q. Du 87 0 0 06 Jun 2025
Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models Yannis Spyridis Vasileios Argyriou 29 0 0 06 Jun 2025
CzechLynx: A Dataset for Individual Identification and Pose Estimation of the Eurasian Lynx Lukás Picek Elisa Belotti Michal Bojda Ludek Bufka Vojtěch Čermák ... Jakub Straka Ludek Toman Vlado Trulık Martin Vana Miroslav Kutal 117 0 0 05 Jun 2025
Bringing SAM to new heights: Leveraging elevation data for tree crown segmentation from drone imagery Mélisande Teng Arthur Ouaknine Etienne Laliberté Yoshua Bengio David Rolnick Hugo Larochelle 176 0 0 05 Jun 2025
CIVET: Systematic Evaluation of Understanding in VLMs Massimo Rizzoli Simone Alghisi Olha Khomyn Gabriel Roccabruna Seyed Mahed Mousavi Giuseppe Riccardi 178 0 0 05 Jun 2025
Track Any Anomalous Object: A Granular Video Anomaly Detection Pipeline Yuzhi Huang Chenxin Li H. Zhang Zixu Lin Yunlong Lin ... Xinyu Liu Jiechao Gao Yue Huang Xinghao Ding Yixuan Yuan 124 0 0 05 Jun 2025
Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction Zesheng Ye C. Cai Ruijiang Dong Jianzhong Qi Lei Feng Pin-Yu Chen Feng Liu 254 0 0 05 Jun 2025
Refer to Anything with Vision-Language Prompts Shengcao Cao Zijun Wei Jason Kuen Kangning Liu Lingzhi Zhang Jiuxiang Gu HyunJoon Jung Liang-Yan Gui Yu Wang VLM 126 0 0 05 Jun 2025