v1v2 (latest)

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

25 February 2019

Silvio Savarese

Papers citing "Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression"

50 / 1,203 papers shown

UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning

445

07 Sep 2025

TinyDef-DETR: A DETR-based Framework for Defect Detection in Transmission Lines from UAV Imagery

243

07 Sep 2025

SparkUI-Parser: Enhancing GUI Perception with Robust Grounding and Parsing

...

120

05 Sep 2025

Heatmap Guided Query Transformers for Robust Astrocyte Detection across Immunostains and Resolutions

Xizhe Zhang

Jiayang Zhu

MedIm

03 Sep 2025

EdgeAttNet: Towards Barb-Aware Filament Segmentation

03 Sep 2025

HERO-VQL: Hierarchical, Egocentric and Robust Visual Query Localization

230

30 Aug 2025

HCCM: Hierarchical Cross-Granularity Contrastive and Matching Learning for Natural Language-Guided Drones

160

29 Aug 2025

Few-Shot Pattern Detection via Template Matching and Regression

130

25 Aug 2025

Explain Before You Answer: A Survey on Compositional Visual Reasoning

...

355

24 Aug 2025

RADAR: A Reasoning-Guided Attribution Framework for Explainable Visual Data Analysis

Anku Rani

Aparna Garimella

Apoorv Saxena

Balaji Vasan Srinivasan

Paul Pu Liang

114

23 Aug 2025

Aligning Moments in Time using Video Queries

279

21 Aug 2025

RATopo: Improving Lane Topology Reasoning via Redundancy Assignment

21 Aug 2025

Inter-Class Relational Loss for Small Object Detection: A Case Study on License Plates

Dian Ning

Dong Seog Han

112

20 Aug 2025

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

Hakjin Lee

Junghoon Seo

Jaehoon Sim

112

20 Aug 2025

Temporal-Conditional Referring Video Object Segmentation with Noise-Free Text-to-Video Diffusion Model

255

19 Aug 2025

CMF-IoU: Multi-Stage Cross-Modal Fusion 3D Object Detection with IoU Joint Prediction

105

18 Aug 2025

Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants

Miftahul Huda

Arsyiah Azahra

Putri Maulida Chairani

Dimas Rizky Ramadhani

Nabila Azhari

Ade Lailani

138

18 Aug 2025

LayoutRectifier: An Optimization-based Post-processing for Graphic Design Layout Generation

I-Chao Shen

Ariel Shamir

Takeo Igarashi

172

15 Aug 2025

Colon Polyps Detection from Colonoscopy Images Using Deep Learning

Md Al Amin

Bikash Kumar Paul

14 Aug 2025

IAG: Input-aware Backdoor Attack on VLM-based Visual Grounding

179

13 Aug 2025

EventRR: Event Referential Reasoning for Referring Video Object Segmentation

315

10 Aug 2025

Dual-Stream Attention with Multi-Modal Queries for Object Detection in Transportation Applications

Noreen Anwar

Guillaume-Alexandre Bilodeau

W. Bouachir

06 Aug 2025

Infrared Object Detection with Ultra Small ConvNets: Is ImageNet Pretraining Still Useful?

Srikanth Muralidharan

130

04 Aug 2025

DMTrack: Spatio-Temporal Multimodal Tracking via Dual-Adapter

105

03 Aug 2025

RMT-PPAD: Real-time Multi-task Learning for Panoptic Perception in Autonomous Driving

161

02 Aug 2025

3D-MOOD: Lifting 2D to 3D for Monocular Open-Set Object Detection

246

31 Jul 2025

Decoupled Spatio-Temporal Consistency Learning for Self-Supervised TrackingAAAI Conference on Artificial Intelligence (AAAI), 2025

250

29 Jul 2025

Detection Transformers Under the Knife: A Neuroscience-Inspired Approach to Ablations

172

29 Jul 2025

Towards Universal Modal Tracking with Online Dense Temporal Token LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

173

27 Jul 2025

JDATT: A Joint Distillation Framework for Atmospheric Turbulence Mitigation and Target Detection

Zhiming Liu

P. Hill

Qirui Yang

239

26 Jul 2025

ATCTrack: Aligning Target-Context Cues with Dynamic Target States for Robust Vision-Language Tracking

183

26 Jul 2025

ABCD: Automatic Blood Cell Detection via Attention-Guided Improved YOLOX

Ahmed Endris Hasen

Yang Shangming

Chiagoziem C. Ukwuoma

Biniyam Gashaw

Abel Zenebe Yutra

146

25 Jul 2025

Demystify Protein Generation with Hierarchical Conditional Diffusion Models

263

24 Jul 2025

Explicit Context Reasoning with Supervision for Visual Tracking

162

22 Jul 2025

LDRFusion: A LiDAR-Dominant multimodal refinement framework for 3D object detection

181

22 Jul 2025

InterpIoU: Rethinking Bounding Box Regression with Interpolation-Based IoU Optimization

Haoyuan Liu

Hiroshi Watanabe

184

16 Jul 2025

Deep Generative Methods and Tire Architecture Design

203

15 Jul 2025

ESG-Net: Event-Aware Semantic Guided Network for Dense Audio-Visual Event Localization

183

14 Jul 2025

When Trackers Date Fish: A Benchmark and Framework for Underwater Multiple Fish Tracking

194

08 Jul 2025

Boosting Temporal Sentence Grounding via Causal Inference

240

07 Jul 2025

DMAT: An End-to-End Framework for Joint Atmospheric Turbulence Mitigation and Object Detection

178

06 Jul 2025

WAVE: Warp-Based View Guidance for Consistent Novel View Synthesis Using a Single Image

228

30 Jun 2025

Grounding DINO-US-SAM: Text-Prompted Multi-Organ Segmentation in Ultrasound with LoRA-Tuned Vision-Language ModelsIEEE Transactions on Ultrasonics, Ferroelectrics and Frequency Control (IEEE TUFFC), 2025

Hamza Rasaee

Taha Koleilat

H. Rivaz

209

30 Jun 2025

Learning Frequency and Memory-Aware Prompts for Multi-Modal Object Tracking

195

30 Jun 2025

R1-Track: Direct Application of MLLMs to Visual Object Tracking via Reinforcement Learning

Biao Wang

Wenwen Li

Jiawei Ge

246

27 Jun 2025

CSDN: A Context-Gated Self-Adaptive Detection Network for Real-Time Object Detection

Haolin Wei

ObjD

246

21 Jun 2025

PR-DETR: Injecting Position and Relation Prior for Dense Video Captioning

186

19 Jun 2025

BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification

362

17 Jun 2025

Text-Aware Image Restoration with Diffusion Models

291

11 Jun 2025

Data-Efficient Challenges in Visual Inductive Priors: A Retrospective

185

10 Jun 2025