Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1709.06158
Cited By

Matterport3D: Learning from RGB-D Data in Indoor Environments

Matterport3D: Learning from RGB-D Data in Indoor Environments

18 September 2017

Thomas Funkhouser

Matthias Nießner

Shuran Song

ArXiv (abs)PDF HTML

Papers citing "Matterport3D: Learning from RGB-D Data in Indoor Environments"

50 / 1,327 papers shown

Fine-Grained Instruction-Guided Graph Reasoning for Vision-and-Language Navigation

Fine-Grained Instruction-Guided Graph Reasoning for Vision-and-Language Navigation

Binkai Ou

Yan Zhong

300

0

0

24 Dec 2025

MVRoom: Controllable 3D Indoor Scene Generation with Multi-View Diffusion Models

MVRoom: Controllable 3D Indoor Scene Generation with Multi-View Diffusion Models

184

0

0

03 Dec 2025

What Is The Best 3D Scene Representation for Robotics? From Geometric to Foundation Models

What Is The Best 3D Scene Representation for Robotics? From Geometric to Foundation Models

...

136

10

0

03 Dec 2025

HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild

HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild

Marie-Julie Rakotosaona

Francis Engelmann

Leonidas Guibas

152

0

0

02 Dec 2025

AirSim360: A Panoramic Simulation Platform within Drone View

AirSim360: A Panoramic Simulation Platform within Drone View

...

Ming-Hsuan Yang

302

4

0

01 Dec 2025

FOD-S2R: A FOD Dataset for Sim2Real Transfer Learning based Object Detection

FOD-S2R: A FOD Dataset for Sim2Real Transfer Learning based Object Detection

Qiranul Saadiyean

Suresh Sundaram

Chandra Sekhar Seelamantula

100

0

0

01 Dec 2025

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

Cordelia Schmid

113

0

0

30 Nov 2025

Audio-Visual World Models: Towards Multisensory Imagination in Sight and Sound

Audio-Visual World Models: Towards Multisensory Imagination in Sight and Sound

197

2

0

30 Nov 2025

Dual-Projection Fusion for Accurate Upright Panorama Generation in Robotic Vision

Dual-Projection Fusion for Accurate Upright Panorama Generation in Robotic Vision

368

0

0

30 Nov 2025

Captain Safari: A World Engine

Captain Safari: A World Engine

241

0

0

28 Nov 2025

DenseScan: Advancing 3D Scene Understanding with 2D Dense Annotation

DenseScan: Advancing 3D Scene Understanding with 2D Dense Annotation

272

0

0

28 Nov 2025

MG-Nav: Dual-Scale Visual Navigation via Sparse Spatial Memory

MG-Nav: Dual-Scale Visual Navigation via Sparse Spatial Memory

123

0

0

27 Nov 2025

Seeing without Pixels: Perception from Camera Trajectories

Seeing without Pixels: Perception from Camera Trajectories

Kristen Grauman

Andrew Zisserman

299

0

0

26 Nov 2025

Active3D: Active High-Fidelity 3D Reconstruction via Hierarchical Uncertainty Quantification

Active3D: Active High-Fidelity 3D Reconstruction via Hierarchical Uncertainty Quantification

220

2

0

25 Nov 2025

Arcadia: Toward a Full-Lifecycle Framework for Embodied Lifelong Learning

Arcadia: Toward a Full-Lifecycle Framework for Embodied Lifelong Learning

Juncheng Billy Li

...

134

1

0

25 Nov 2025

DAPointMamba: Domain Adaptive Point Mamba for Point Cloud Completion

DAPointMamba: Domain Adaptive Point Mamba for Point Cloud Completion

Richard Dazeley

269

0

0

25 Nov 2025

MODEST: Multi-Optics Depth-of-Field Stereo Dataset

MODEST: Multi-Optics Depth-of-Field Stereo Dataset

Nisarg K. Trivedi

Vinayak A. Belludi

480

0

0

25 Nov 2025

Wanderland: Geometrically Grounded Simulation for Open-World Embodied AI

Wanderland: Geometrically Grounded Simulation for Open-World Embodied AI

206

0

0

25 Nov 2025

Disc3D: Automatic Curation of High-Quality 3D Dialog Data via Discriminative Object Referring

Disc3D: Automatic Curation of High-Quality 3D Dialog Data via Discriminative Object Referring

241

0

0

24 Nov 2025

DetAny4D: Detect Anything 4D Temporally in a Streaming RGB Video

DetAny4D: Detect Anything 4D Temporally in a Streaming RGB Video

179

0

0

24 Nov 2025

C3Po: Cross-View Cross-Modality Correspondence by Pointmap Prediction

C3Po: Cross-View Cross-Modality Correspondence by Pointmap Prediction

Bharath Hariharan

413

1

0

23 Nov 2025

MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots

MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots

163

7

0

22 Nov 2025

FlexiCup: Wireless Multimodal Suction Cup with Dual-Zone Vision-Tactile Sensing

FlexiCup: Wireless Multimodal Suction Cup with Dual-Zone Vision-Tactile Sensing

...

193

12

0

18 Nov 2025

RoboTidy : A 3D Gaussian Splatting Household Tidying Benchmark for Embodied Navigation and Action

RoboTidy : A 3D Gaussian Splatting Household Tidying Benchmark for Embodied Navigation and Action

387

1

0

18 Nov 2025

SocialNav-Map: Dynamic Mapping with Human Trajectory Prediction for Zero-Shot Social Navigation

SocialNav-Map: Dynamic Mapping with Human Trajectory Prediction for Zero-Shot Social Navigation

236

1

0

15 Nov 2025

Large Language Models and 3D Vision for Intelligent Robotic Perception and Autonomy

Large Language Models and 3D Vision for Intelligent Robotic Perception and AutonomyItalian National Conference on Sensors (INS), 2025

Karthick Thiyagarajan

419

4

0

14 Nov 2025

Visual Spatial Tuning

Visual Spatial Tuning

...

Hengshuang Zhao

392

17

0

07 Nov 2025

Room Envelopes: A Synthetic Dataset for Indoor Layout Reconstruction from Images

Room Envelopes: A Synthetic Dataset for Indoor Layout Reconstruction from Images

258

0

0

06 Nov 2025

MacroNav: Multi-Task Context Representation Learning Enables Efficient Navigation in Unknown Environments

MacroNav: Multi-Task Context Representation Learning Enables Efficient Navigation in Unknown Environments

221

1

0

06 Nov 2025

A Step Toward World Models: A Survey on Robotic Manipulation

A Step Toward World Models: A Survey on Robotic Manipulation

857

6

0

31 Oct 2025

NaviTrace: Evaluating Embodied Navigation of Vision-Language Models

NaviTrace: Evaluating Embodied Navigation of Vision-Language Models

Richard Schwarzkopf

Rudolf Lioutikov

493

6

0

30 Oct 2025

NVSim: Novel View Synthesis Simulator for Large Scale Indoor Navigation

NVSim: Novel View Synthesis Simulator for Large Scale Indoor Navigation

Andrew Jaeyong Choi

142

0

0

28 Oct 2025

STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization

STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization

172

3

0

27 Oct 2025

HyPerNav: Hybrid Perception for Object-Oriented Navigation in Unknown Environment

HyPerNav: Hybrid Perception for Object-Oriented Navigation in Unknown Environment

172

0

0

27 Oct 2025

Towards Physically Executable 3D Gaussian for Embodied Navigation

Towards Physically Executable 3D Gaussian for Embodied Navigation

...

Juncheng Billy Li

256

2

0

24 Oct 2025

HiFi-HARP: A High-Fidelity 7th-Order Ambisonic Room Impulse Response Dataset

HiFi-HARP: A High-Fidelity 7th-Order Ambisonic Room Impulse Response Dataset

Jürgen Peissig

94

0

0

24 Oct 2025

C-NAV: Towards Self-Evolving Continual Object Navigation in Open World

C-NAV: Towards Self-Evolving Continual Object Navigation in Open World

250

3

0

23 Oct 2025

SEA: Semantic Map Prediction for Active Exploration of Uncertain Areas

SEA: Semantic Map Prediction for Active Exploration of Uncertain Areas

207

0

0

22 Oct 2025

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

159

2

0

22 Oct 2025

PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting

PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting

Shangzhan Zhang

246

1

0

21 Oct 2025

Embodied Navigation with Auxiliary Task of Action Description Prediction

Embodied Navigation with Auxiliary Task of Action Description Prediction

177

1

0

21 Oct 2025

World-in-World: World Models in a Closed-Loop World

World-in-World: World Models in a Closed-Loop World

...

279

13

0

20 Oct 2025

HouseTour: A Virtual Real Estate A(I)gent

HouseTour: A Virtual Real Estate A(I)gent

283

3

0

20 Oct 2025

NavQ: Learning a Q-Model for Foresighted Vision-and-Language Navigation

NavQ: Learning a Q-Model for Foresighted Vision-and-Language Navigation

177

1

0

18 Oct 2025

GaussGym: An open-source real-to-sim framework for learning locomotion from pixels

GaussGym: An open-source real-to-sim framework for learning locomotion from pixels

Alejandro Escontrela

Arthur Allshire

Carmelo Sferrazza

191

14

0

17 Oct 2025

QuASH: Using Natural-Language Heuristics to Query Visual-Language Robotic Maps

QuASH: Using Natural-Language Heuristics to Query Visual-Language Robotic Maps

Francesco Verdoja

161

0

0

16 Oct 2025

Into the Unknown: Towards using Generative Models for Sampling Priors of Environment Uncertainty for Planning in Configuration Spaces

Into the Unknown: Towards using Generative Models for Sampling Priors of Environment Uncertainty for Planning in Configuration Spaces

Subhransu S. Bhattacharjee

144

1

0

13 Oct 2025

SNAP: Towards Segmenting Anything in Any Point Cloud

SNAP: Towards Segmenting Anything in Any Point Cloud

Charles Saunders

Aruni RoyChowdhury

182

0

0

13 Oct 2025

Audio-Guided Visual Perception for Audio-Visual Navigation

Audio-Guided Visual Perception for Audio-Visual Navigation

139

0

0

13 Oct 2025

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

170

7

0

13 Oct 2025

1 2 3 4...25 26 27

Page 1 of 27

Pageof 27