v1v2v3v4 (latest)

Deformable DETR: Deformable Transformers for End-to-End Object Detection

International Conference on Learning Representations (ICLR), 2020

8 October 2020

Weijie Su

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)Github (3553★)

Papers citing "Deformable DETR: Deformable Transformers for End-to-End Object Detection"

50 / 2,782 papers shown

InteractionMap: Improving Online Vectorized HDMap Construction with InteractionComputer Vision and Pattern Recognition (CVPR), 2025

Kuang Wu

Chuan Yang

Zhanbin Li

287

27 Mar 2025

Leveraging 3D Geometric Priors in 2D Rotation Symmetry DetectionComputer Vision and Pattern Recognition (CVPR), 2025

Ahyun Seo

Minsu Cho

360

26 Mar 2025

UniSTD: Towards Unified Spatio-Temporal Learning across Diverse DisciplinesComputer Vision and Pattern Recognition (CVPR), 2025

287

26 Mar 2025

FireEdit: Fine-grained Instruction-based Image Editing via Region-aware Vision Language ModelComputer Vision and Pattern Recognition (CVPR), 2025

375

25 Mar 2025

BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata ExtractionIEEE International Conference on Document Analysis and Recognition (ICDAR), 2025

199

25 Mar 2025

Your ViT is Secretly an Image Segmentation ModelComputer Vision and Pattern Recognition (CVPR), 2025

324

24 Mar 2025

FG$^2$: Fine-Grained Cross-View Localization by Fine-Grained Feature Matching

^2

: Fine-Grained Cross-View Localization by Fine-Grained Feature MatchingComputer Vision and Pattern Recognition (CVPR), 2025

Zimin Xia

Alexandre Alahi

380

24 Mar 2025

CQ-DINO: Mitigating Gradient Dilution via Category Queries for Vast Vocabulary Object Detection

467

24 Mar 2025

Benchmarking Object Detectors under Real-World Distribution Shifts in Satellite ImageryComputer Vision and Pattern Recognition (CVPR), 2025

Sara Al-Emadi

Yin Yang

Ferda Ofli

236

24 Mar 2025

An Image-like Diffusion Method for Human-Object Interaction DetectionComputer Vision and Pattern Recognition (CVPR), 2025

356

23 Mar 2025

SGFormer: Satellite-Ground Fusion for 3D Semantic Scene CompletionComputer Vision and Pattern Recognition (CVPR), 2025

335

21 Mar 2025

UniHDSA: A Unified Relation Prediction Approach for Hierarchical Document Structure AnalysisPattern Recognition (Pattern Recogn.), 2025

Jiawei Wang

Kai Hu

Qiang Huo

311

20 Mar 2025

DynamicVis: An Efficient and General Visual Foundation Model for Remote Sensing Image Understanding

300

20 Mar 2025

SpiLiFormer: Enhancing Spiking Transformers with Lateral Inhibition

277

20 Mar 2025

3D Occupancy Prediction with Low-Resolution Queries via Prototype-aware View TransformationComputer Vision and Pattern Recognition (CVPR), 2025

252

19 Mar 2025

State Space Model Meets Transformer: A New Paradigm for 3D Object DetectionInternational Conference on Learning Representations (ICLR), 2025

504

18 Mar 2025

LipShiFT: A Certifiably Robust Shift-based Vision Transformer

Rohan Menon

Nicola Franco

Stephan Günnemann

298

18 Mar 2025

SimWorld: A Unified Benchmark for Simulator-Conditioned Scene Generation via World Model

392

18 Mar 2025

Panoramic Distortion-Aware Tokenization for Person Detection and Localization in Overhead Fisheye Images

469

18 Mar 2025

MamBEV: Enabling State Space Models to Learn Birds-Eye-View RepresentationsInternational Conference on Learning Representations (ICLR), 2025

479

18 Mar 2025

Is Discretization Fusion All You Need for Collaborative Perception?IEEE International Conference on Robotics and Automation (ICRA), 2025

441

18 Mar 2025

TGBFormer: Transformer-GraphFormer Blender Network for Video Object DetectionAAAI Conference on Artificial Intelligence (AAAI), 2025

Qiang Qi

Xiao Wang

ViT

1.1K

18 Mar 2025

8-Calves Image dataset

942

17 Mar 2025

AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction

289

17 Mar 2025

Action tube generation by person query matching for spatio-temporal action detection

Kazuki Omi

Jion Oshima

Toru Tamaki

379

17 Mar 2025

L2COcc: Lightweight Camera-Centric Semantic Scene Completion via Distillation of LiDAR Model

393

16 Mar 2025

Exploring Contextual Attribute Density in Referring Expression CountingComputer Vision and Pattern Recognition (CVPR), 2025

262

16 Mar 2025

History-Aware Transformation of ReID Features for Multiple Object Tracking

424

16 Mar 2025

Minuscule Cell Detection in AS-OCT Images with Progressive Field-of-View FocusingInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

281

15 Mar 2025

Cyclic Contrastive Knowledge Transfer for Open-Vocabulary Object DetectionInternational Conference on Learning Representations (ICLR), 2025

1.1K

14 Mar 2025

Bring Your Rear Cameras for Egocentric 3D Human Pose Estimation

402

14 Mar 2025

Active Learning from Scene Embeddings for End-to-End Autonomous Driving

406

14 Mar 2025

A Hierarchical Semantic Distillation Framework for Open-Vocabulary Object Detection

257

13 Mar 2025

MonoDGP: Monocular 3D Object Detection with Decoupled-Query and Geometry-Error PriorsComputer Vision and Pattern Recognition (CVPR), 2024

383

13 Mar 2025

Foundation X: Integrating Classification, Localization, and Segmentation through Lock-Release Pretraining Strategy for Chest X-ray AnalysisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

N. Islam

Dongao Ma

Jiaxuan Pang

Shivasakthi Senthil Velan

Michael B. Gotway

Jianming Liang

248

12 Mar 2025

DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection

587

12 Mar 2025

Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language ModelChemical Science (Chem. Sci.), 2025

242

11 Mar 2025

SparseVoxFormer: Sparse Voxel-based Transformer for Multi-modal 3D Object Detection

265

11 Mar 2025

Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis

542

11 Mar 2025

Chameleon: Fast-slow Neuro-symbolic Lane Topology ExtractionIEEE International Conference on Robotics and Automation (ICRA), 2025

...

367

10 Mar 2025

Rethinking Two-Stage Referring-by-Tracking in Referring Multi-Object Tracking: Make it Strong Again

414

10 Mar 2025

YOLOE: Real-Time Seeing Anything

549

10 Mar 2025

SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements

370

10 Mar 2025

LEGO-Motion: Learning-Enhanced Grids with Occupancy Instance Modeling for Class-Agnostic Motion Prediction

263

10 Mar 2025

Removing Multiple Hybrid Adverse Weather in Video via a Unified Model

256

08 Mar 2025

Rethinking Lanes and Points in Complex Scenarios for Monocular 3D Lane DetectionComputer Vision and Pattern Recognition (CVPR), 2025

360

08 Mar 2025

FastMap: Fast Queries Initialization Based Vectorized HD Map Reconstruction Framework

196

07 Mar 2025

A lightweight model FDM-YOLO for small target improvement based on YOLOv8

Xuerui Zhang

ObjD

258

06 Mar 2025

Prediction of Frozen Region Growth in Kidney Cryoablation Intervention Using a 3D Flow-Matching Model

Sekeun KimHyun Jin Cho

322

06 Mar 2025

Omnidirectional Multi-Object TrackingComputer Vision and Pattern Recognition (CVPR), 2025

473

06 Mar 2025