Objectron: A Large Scale Dataset of Object-Centric Videos in the Wild with Pose Annotations

Computer Vision and Pattern Recognition (CVPR), 2020

18 December 2020

Papers citing "Objectron: A Large Scale Dataset of Object-Centric Videos in the Wild with Pose Annotations"

50 / 126 papers shown

4DLangVGGT: 4D Language-Visual Geometry Grounded Transformer

292

04 Dec 2025

UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data

239

27 Nov 2025

LocateAnything3D: Vision-Language 3D Detection with Chain-of-Sight

180

25 Nov 2025

DetAny4D: Detect Anything 4D Temporally in a Streaming RGB Video

198

24 Nov 2025

Concept than Document: Context Compression via AMR-based Conceptual Entropy

263

24 Nov 2025

SceneDesigner: Controllable Multi-Object Image Generation with 9-DoF Pose Manipulation

262

20 Nov 2025

Visual Spatial Tuning

...

421

07 Nov 2025

iFlyBot-VLM Technical Report

376

07 Nov 2025

Neural USD: An object-centric framework for iterative editing and control

Alejandro Escontrela

Shrinu Kushagra

Sjoerd van Steenkiste

203

28 Oct 2025

Monocular Visual 8D Pose Estimation for Articulated Bicycles and Cyclists

Eduardo R. Corral-Soto

162

23 Oct 2025

MultiCOIN: Multi-Modal COntrollable Video INbetweening

238

09 Oct 2025

Robotic Manipulation Framework Based on Semantic Keypoints for Packing Shoes of Different Sizes, Shapes, and Softness

215

07 Sep 2025

3D-MOOD: Lifting 2D to 3D for Monocular Open-Set Object Detection

320

31 Jul 2025

Boosting Multi-View Indoor 3D Object Detection via Adaptive 3D Volume Construction

237

24 Jul 2025

Unfolding Spatial Cognition: Evaluating Multimodal Models on Visual Simulations

288

05 Jun 2025

Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs Supplementary

500

27 May 2025

Marginalized Generalized IoU (MGIoU): A Unified Objective Function for Optimizing Any Convex Parametric Shapes

442

23 Apr 2025

GATE3D: Generalized Attention-based Task-synergized Estimation in 3D*

Eunsoo Im

Jung Kwon Lee

Changhyun Jee

659

15 Apr 2025

OpenLex3D: A Tiered Evaluation Benchmark for Open-Vocabulary 3D Scene Representations

381

25 Mar 2025

AxisPose: Model-Free Matching-Free Single-Shot 6D Object Pose Estimation via Axis Generation

273

09 Mar 2025

Enriching physical-virtual interaction in AR gaming by tracking identical objects via an egocentric partial observation frame

Liuchuan Yu

Ching-I Huang

Hsueh-Cheng Wang

L. Yu

244

24 Feb 2025

MVIP -- A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition

Paul Koch

Marian Schluter

Jörg Krüger

334

24 Feb 2025

Glissando-Net: Deep sinGLe vIew category level poSe eStimation ANd 3D recOnstructionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

470

28 Jan 2025

GSOT3D: Towards Generic 3D Single Object Tracking in the Wild

300

03 Dec 2024

Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration

469

26 Nov 2024

Open Vocabulary Monocular 3D Object Detection

638

25 Nov 2024

CameraHMR: Aligning People with PerspectiveInternational Conference on 3D Vision (3DV), 2024

Priyanka Patel

Michael J. Black

3DH 3DGS

272

12 Nov 2024

MVSDet: Multi-View Indoor 3D Object Detection via Efficient Plane SweepsNeural Information Processing Systems (NeurIPS), 2024

351

28 Oct 2024

MetaFood3D: Large 3D Food Object Dataset with Nutrition Values

Yuhao Chen

...

Fengqing Zhu

274

03 Sep 2024

CatFree3D: Category-agnostic 3D Object Detection with DiffusionInternational Conference on 3D Vision (3DV), 2024

Wenjing Bian

Zirui Wang

Andrea Vedaldi

357

22 Aug 2024

ADen: Adaptive Density Representations for Sparse-view Camera Pose EstimationEuropean Conference on Computer Vision (ECCV), 2024

Weiyao Wang

268

16 Aug 2024

LLMI3D: MLLM-based 3D Perception from a Single 2D Image

Fan Yang

Sicheng Zhao

Yanhao Zhang

Haoxiang Chen

Hui Chen

Wenbo Tang

Guiguang Ding

310

14 Aug 2024

DEF-oriCORN: efficient 3D scene understanding for robust language-directed manipulation without demonstrations

336

31 Jul 2024

Floating No More: Object-Ground Reconstruction from a Single Image

426

26 Jul 2024

OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects

Akshay Krishnan

Abhijit Kundu

Kevis-Kokitsi Maninis

James Hays

Matthew Brown

226

11 Jul 2024

RoCap: A Robotic Data Collection Pipeline for the Pose Estimation of Appearance-Changing Objects

Takeo Igarashi

251

10 Jul 2024

ImageNet3D: Towards General-Purpose Object-Level 3D Understanding

Yaoyao Liu

Alan Yuille

VLM 3DV

303

13 Jun 2024

Neural Assets: 3D-Aware Multi-Object Scene Synthesis with Image Diffusion Models

Sjoerd van Steenkiste

Kelsey R. Allen

Thomas Kipf

VGen DiffM

393

13 Jun 2024

DiffCalib: Reformulating Monocular Camera Calibration as Diffusion-Based Dense Incident Map Generation

Hao Chen

355

24 May 2024

Deep Learning-Based Object Pose Estimation: A Comprehensive Survey

610

13 May 2024

Language-Image Models with 3D UnderstandingInternational Conference on Learning Representations (ICLR), 2024

Jang Hyun Cho

Boris Ivanovic

Yulong Cao

Edward Schmerling

Yue Wang

...

Boyi Li

242

06 May 2024

Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation

Roland Siegwart

224

21 Mar 2024

A survey of synthetic data augmentation methods in computer visionMachine Intelligence Research (MIR), 2024

A. Mumuni

F. Mumuni

N. K. Gerrar

385

15 Mar 2024

UniMODE: Unified Monocular 3D Object Detection

439

28 Feb 2024

Advances in 3D Generation: A Survey

Xiaoyu Li

Ying Shan

404

31 Jan 2024

RGBD Objects in the Wild: Scaling Real-World 3D Object Learning from RGB-D VideosComputer Vision and Pattern Recognition (CVPR), 2024

Hongchi Xia

Yang Fu

Sifei Liu

Xiaolong Wang

443

23 Jan 2024

Towards Real-World Aerial Vision Guidance with Categorical 6D Pose TrackerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

Jingtao Sun

Yaonan Wang

Danwei Wang

410

09 Jan 2024

Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action

379

310

28 Dec 2023

DL3DV-10K: A Large-Scale Scene Dataset for Deep Learning-based 3D Vision

...

669

361

26 Dec 2023

PACE: A Large-Scale Dataset with Pose Annotations in Cluttered Environments

462

23 Dec 2023