v1v2 (latest)

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

25 February 2019

Silvio Savarese

Papers citing "Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression"

50 / 1,104 papers shown

Title
POSTURE: Pose Guided Unsupervised Domain Adaptation for Human Body Part Segmentation Arindam Dutta Rohit Lal Yash Garg Calvin-Khang Ta Dripta S. Raychaudhuri Hannah Dela Cruz Amit K. Roy-Chowdhury 104 1 0 04 Jul 2024
ACTRESS: Active Retraining for Semi-supervised Visual Grounding Weitai Kang Mengxue Qu Yunchao Wei Yan Yan 107 6 0 03 Jul 2024
Visual Grounding with Attention-Driven Constraint Balancing Weitai Kang Luowei Zhou Junyi Wu Changchang Sun Yan Yan 74 4 0 03 Jul 2024
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding Weitai Kang Gaowen Liu Mubarak Shah Yan Yan ObjD 119 9 0 03 Jul 2024
$Explainable vertebral fracture analysis with uncertainty estimation using differentiable rule-based classification$ Explainable vertebral fracture analysis with uncertainty estimation using differentiable rule-based classification Victor Wåhlstrand Skärström L. Johansson Jennifer Alvén M. Lorentzon Ida Häggström 68 1 0 03 Jul 2024
Similarity Distance-Based Label Assignment for Tiny Object Detection Shuohao Shi Qiang Fang Tong Zhao Xin Xu ObjD 116 4 0 02 Jul 2024
Fake News Detection and Manipulation Reasoning via Large Vision-Language Models Ruihan Jin Ruibo Fu Zhengqi Wen Shuai Zhang Yukun Liu Jianhua Tao 88 5 0 02 Jul 2024
A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding Jinghui Lu Haiyang Yu Yanjie Wang Yongjie Ye Jingqun Tang ... Qi Liu Hao Feng Han Wang Hao Liu Can Huang 178 23 0 02 Jul 2024
Robot Instance Segmentation with Few Annotations for Grasping Moshe Kimhi David Vainshtein Chaim Baskin Dotan Di Castro 125 2 0 01 Jul 2024
eMoE-Tracker: Environmental MoE-based Transformer for Robust Event-guided Object Tracking Yucheng Chen Lin Wang 78 3 0 28 Jun 2024
Weighted Circle Fusion: Ensembling Circle Representation from Different Object Detection Results Jialin Yue Tianyuan Yao Ruining Deng Quan Liu Juming Xiong Haichun Yang Yuankai Huo 42 1 0 27 Jun 2024
Looking 3D: Anomaly Detection with 2D-3D Alignment A. Bhunia Changjian Li Hakan Bilen 92 4 0 27 Jun 2024
STAL3D: Unsupervised Domain Adaptation for 3D Object Detection via Collaborating Self-Training and Adversarial Learning Yanan Zhang Chao Zhou Di Huang 78 6 0 27 Jun 2024
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges Robert-Jan Bruintjes A. Lengyel Marcos Baptista-Rios O. Kayhan Davide Zambrano Nergis Tomen Jan van Gemert VLM 96 0 0 26 Jun 2024
ScanFormer: Referring Expression Comprehension by Iteratively Scanning Wei Su Peihan Miao Huanzhang Dou Xi Li ObjD 105 9 0 26 Jun 2024
Live Video Captioning Eduardo Blanco-Fernández Carlos Gutiérrez-Álvarez Nadia Nasri Saturnino Maldonado-Bascón Roberto J. López-Sastre 76 0 0 20 Jun 2024
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation Ci-Siang Lin I-Jieh Liu Min-Hung Chen Chien-Yi Wang Sifei Liu Yu-Chiang Frank Wang VOS 93 0 0 18 Jun 2024
Adaptively Bypassing Vision Transformer Blocks for Efficient Visual Tracking Xiangyang Yang Dan Zeng Xucheng Wang You Wu Hengzhou Ye Qijun Zhao Shuiwang Li 108 4 0 12 Jun 2024
RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker Yunfeng Li Bo Wang Jiuran Sun Xueyi Wu Ye Li 98 4 0 11 Jun 2024
LW-DETR: A Transformer Replacement to YOLO for Real-Time Detection Qiang Chen Xiangbo Su Xinyu Zhang Jian Wang Jiahui Chen ... Shan Zhang Kun Yao Errui Ding Gang Zhang Jingdong Wang ViT 118 21 0 05 Jun 2024
Enhanced Automotive Object Detection via RGB-D Fusion in a DiffusionDet Framework Eliraz Orfaig Inna Stainvas Igal Bilik 63 0 0 05 Jun 2024
Mixup Augmentation with Multiple Interpolations Lifeng Shen Jincheng Yu Hansi Yang James T. Kwok 70 0 0 03 Jun 2024
Learning Manipulation by Predicting Interaction Jia Zeng Qingwen Bu Bangjun Wang Wenke Xia Li Chen ... Heming Cui Bin Zhao Xuelong Li Yu Qiao Hongyang Li 134 26 0 01 Jun 2024
Towards Unified Multi-granularity Text Detection with Interactive Attention Xingyu Wan Chengquan Zhang Pengyuan Lyu Sen Fan Zihan Ni Kun Yao Errui Ding Jingdong Wang 92 2 0 30 May 2024
OED: Towards One-stage End-to-End Dynamic Scene Graph Generation Guan-Bo Wang Zhiming Li Qingchao Chen Yang Liu 103 11 0 27 May 2024
An Enhanced Encoder-Decoder Network Architecture for Reducing Information Loss in Image Semantic Segmentation Zijun Gao Qi Wang Taiyuan Mei X. Cheng Yun Zi Haowei Yang 89 11 0 26 May 2024
Enhanced Object Tracking by Self-Supervised Auxiliary Depth Estimation Learning Zhenyu Wei Yujie He Zhanchuan Cai MDE 84 0 0 23 May 2024
A Multimodal Learning-based Approach for Autonomous Landing of UAV Francisco Neves Luís Branco Maria Pereira R. Claro Andry Pinto 31 1 0 21 May 2024
Context-Enhanced Video Moment Retrieval with Large Language Models Weijia Liu Bo Miao Jiuxin Cao Xueling Zhu Bo Liu Mehwish Nasim Ajmal Mian 130 2 0 21 May 2024
FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection Siliang Ma Yong Xu 45 2 0 16 May 2024
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network Zhaoxu Li Wei An Gaowei Guo Longguang Wang Yingqian Wang Zaiping Lin ViT 207 0 0 16 May 2024
MetaFruit Meets Foundation Models: Leveraging a Comprehensive Multi-Fruit Dataset for Advancing Agricultural Foundation Models Jiajia Li Kyle Lammers Xunyuan Yin Xiang Yin Long He Renfu Lu Zhaojian Li 98 3 0 14 May 2024
PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification Fatema Tuj Johora Faria Mukaffi Bin Moin Mohammad Shafiul Alam Ahmed Al Wase Md. Rabius Sani Khan Md. Hasib MedIm 56 2 0 12 May 2024
Replication Study and Benchmarking of Real-Time Object Detection Models Pierre-Luc Asselin Vincent Coulombe William Guimont-Martin William Larrivée-Hardy 88 0 0 11 May 2024
FlexEControl: Flexible and Efficient Multimodal Control for Text-to-Image Generation Xuehai He Jian Zheng Jacob Zhiyuan Fang Robinson Piramuthu Mohit Bansal Vicente Ordonez Gunnar Sigurdsson Nanyun Peng Xin Eric Wang DiffM 94 1 0 08 May 2024
Lumbar Spine Tumor Segmentation and Localization in T2 MRI Images Using AI Rikathi Pal Sudeshna Mondal Aditi Gupta Priya Saha Somoballi Ghoshal Amlan Chakrabarti S. Sur-Kolay 65 4 0 07 May 2024
Low-light Object Detection Pengpeng Li Hao Gu Yang Yang 67 1 0 06 May 2024
Enhancing DETRs Variants through Improved Content Query and Similar Query Aggregation Yingying Zhang Chuangji Shi Xin Guo Jiangwei Lao Jian Wang Jiaotuan Wang Jingdong Chen 81 3 0 06 May 2024
Federated Learning with Heterogeneous Data Handling for Robust Vehicular Object Detection Ahmad Khalil Tizian Dege Pegah Golchin Rostyslav Olshevskyi Antonio Fernández Anta Tobias Meuser FedML 54 1 0 02 May 2024
New Benchmark Dataset and Fine-Grained Cross-Modal Fusion Framework for Vietnamese Multimodal Aspect-Category Sentiment Analysis Quy Hoang Nguyen Minh-Van Truong Nguyen Kiet Van Nguyen 77 2 0 01 May 2024
CofiPara: A Coarse-to-fine Paradigm for Multimodal Sarcasm Target Identification with Large Multimodal Models Hongzhan Lin Zixin Chen Ziyang Luo Mingfei Cheng Jing Ma Guang Chen 91 6 0 01 May 2024
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization Yuliang Liu Mingxin Huang Hao Yan Linger Deng Weijia Wu Hao Lu Chunhua Shen Lianwen Jin Xiang Bai 86 0 0 30 Apr 2024
Why does Knowledge Distillation Work? Rethink its Attention and Fidelity Mechanism Chenqi Guo Shiwei Zhong Xiaofeng Liu Qianli Feng Yinglong Ma 80 4 0 30 Apr 2024
Panoptic Segmentation and Labelling of Lumbar Spine Vertebrae using Modified Attention Unet Rikathi Pal Priya Saha Somoballi Ghoshal Amlan Chakrabarti S. Sur-Kolay 33 1 0 28 Apr 2024
Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer Xinpeng Li Teng Wang Jian Zhao Shuyi Mao Jinbao Wang Feng Zheng Xiaojiang Peng Xuelong Li 92 1 0 26 Apr 2024
Surgical-DeSAM: Decoupling SAM for Instrument Segmentation in Robotic Surgery Yuyang Sheng Sophia Bano Matthew J. Clarkson Mobarakol Islam 78 8 0 22 Apr 2024
PM-VIS: High-Performance Box-Supervised Video Instance Segmentation Zhangjing Yang Dun Liu Wensheng Cheng Jinqiao Wang Yi Wu VLM 65 2 0 22 Apr 2024
HiVG: Hierarchical Multimodal Fine-grained Modulation for Visual Grounding Linhui Xiao Xiaoshan Yang Fang Peng Yaowei Wang Changsheng Xu ObjD 135 12 0 20 Apr 2024
Simultaneous Detection and Interaction Reasoning for Object-Centric Action Recognition Xunsong Li Pengzhan Sun Yangcen Liu Lixin Duan Wen Li 124 3 0 18 Apr 2024
Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization Yongdong Luo Haojia Lin Xiawu Zheng Yigeng Jiang Chia-Wen Lin Jie Hu Guannan Jiang Songan Zhang Rongrong Ji 67 0 0 17 Apr 2024