v1v2 (latest)

OpenVLA: An Open-Source Vision-Language-Action Model

13 June 2024

Quan Vuong

Dorsa Sadigh

Percy Liang

Chelsea Finn

LM&Ro

VLM

ArXiv (abs)PDF HTML HuggingFace (40 upvotes)

Papers citing "OpenVLA: An Open-Source Vision-Language-Action Model"

50 / 723 papers shown

METIS: Multi-Source Egocentric Training for Integrated Dexterous Vision-Language-Action Model

226

21 Nov 2025

Stable Offline Hand-Eye Calibration for any Robot with Just One Mark

189

21 Nov 2025

RynnVLA-002: A Unified Vision-Language-Action and World Model

...

325

21 Nov 2025

H-GAR: A Hierarchical Interaction Framework via Goal-Driven Observation-Action Refinement for Robotic Manipulation

222

21 Nov 2025

SPEAR-1: Scaling Beyond Robot Demonstrations via 3D Understanding

429

21 Nov 2025

IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation

...

164

21 Nov 2025

RoboCOIN: An Open-Sourced Bimanual Robotic Data COllection for INtegrated Manipulation

...

205

21 Nov 2025

Learning Diffusion Policies for Robotic Manipulation of Timber Joinery under Fabrication Uncertainty

107

21 Nov 2025

VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic Manipulation

Hanyu Zhou

Chuanhao Ma

Gim Hee Lee

193

21 Nov 2025

BOP-ASK: Object-Interaction Reasoning for Vision-Language Models

Prashanth Krishnamurthy

253

20 Nov 2025

FT-NCFM: An Influence-Aware Data Distillation Framework for Efficient VLA Models

20 Nov 2025

When Alignment Fails: Multimodal Adversarial Attacks on Vision-Language-Action Models

333

20 Nov 2025

InternData-A1: Pioneering High-Fidelity Synthetic Data for Pre-training Generalist Policy

...

136

20 Nov 2025

Mantis: A Versatile Vision-Language-Action Model with Disentangled Visual Foresight

207

20 Nov 2025

VLA-Pruner: Temporal-Aware Dual-Level Visual Token Pruning for Efficient Vision-Language-Action Inference

327

20 Nov 2025

In-N-On: Scaling Egocentric Manipulation with in-the-wild and on-task Data

366

19 Nov 2025

SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models

132

19 Nov 2025

Theoretical Closed-loop Stability Bounds for Dynamical System Coupled with Diffusion Policies

Gabriel Lauzier

Alexandre Girard

François Ferland

19 Nov 2025

HMC: Learning Heterogeneous Meta-Control for Contact-Rich Loco-Manipulation

100

18 Nov 2025

FlexiCup: Wireless Multimodal Suction Cup with Dual-Zone Vision-Tactile Sensing

...

153

18 Nov 2025

VLA-R: Vision-Language Action Retrieval toward Open-World End-to-End Autonomous Driving

202

16 Nov 2025

Decoupled Action Head: Confining Task Knowledge to Conditioning Layers

115

15 Nov 2025

AttackVLA: Benchmarking Adversarial and Backdoor Attacks on Vision-Language-Action Models

361

15 Nov 2025

Audio-VLA: Adding Contact Audio Perception to Vision-Language-Action Model for Robotic Manipulation

246

13 Nov 2025

SemanticVLA: Semantic-Aligned Sparsification and Enhancement for Efficient Robotic Manipulation

370

13 Nov 2025

Learning a Thousand Tasks in a DayScience Robotics (Sci. Robot.), 2025

409

13 Nov 2025

ViPRA: Video Prediction for Robot Actions

242

11 Nov 2025

SlotVLA: Towards Modeling of Object-Relation Representations in Robotic Manipulation

...

278

10 Nov 2025

How Do VLAs Effectively Inherit from VLMs?

298

10 Nov 2025

ExpReS-VLA: Specializing Vision-Language-Action Models Through Experience Replay and Retrieval

110

09 Nov 2025

From Words to Safety: Language-Conditioned Safety Filtering for Robot Navigation

Zeyuan Feng

Haimingyue Zhang

Somil Bansal

08 Nov 2025

10 Open Challenges Steering the Future of Vision-Language-Action Models

329

08 Nov 2025

Towards Human-AI-Robot Collaboration and AI-Agent based Digital Twins for Parkinson's Disease Management: Review and Outlook

Hassan Hizeh

Rim Chighri

Muhammad Mahboob Ur Rahman

Mohamed A. Bahloul

Ali Muqaibel

Tareq Y. Al-Naffouri

125

08 Nov 2025

Let Me Show You: Learning by Retrieving from Egocentric Video for Robotic Manipulation

Yichen Zhu

Feifei Feng

121

07 Nov 2025

Visual Spatial Tuning

...

347

07 Nov 2025

EveryDayVLA: A Vision-Language-Action Model for Affordable Robotic Manipulation

07 Nov 2025

Evo-1: Lightweight Vision-Language-Action Model with Preserved Semantic Alignment

...

170

06 Nov 2025

Real-to-Sim Robot Policy Evaluation with Gaussian Splatting Simulation of Soft-Body Interactions

324

06 Nov 2025

Cambrian-S: Towards Spatial Supersensing in Video

...

178

06 Nov 2025

GraSP-VLA: Graph-based Symbolic Action Representation for Long-Horizon Planning with VLA Policies

06 Nov 2025

GUIDES: Guidance Using Instructor-Distilled Embeddings for Pre-trained Robot Policy Enhancement

191

05 Nov 2025

LACY: A Vision-Language Model-based Language-Action Cycle for Self-Improving Robotic Manipulation

230

04 Nov 2025

XR-1: Towards Versatile Vision-Language-Action Models via Learning Unified Vision-Motion Representations

...

269

04 Nov 2025

Learning Interactive World Model for Object-Centric Reinforcement Learning

318

04 Nov 2025

PixelVLA: Advancing Pixel-level Understanding in Vision-Language-Action Model

217

03 Nov 2025

Scaling Cross-Embodiment World Models for Dexterous Manipulation

Henrik I. Christensen

H. Su

200

03 Nov 2025

RobustVLA: Robustness-Aware Reinforcement Post-Training for Vision-Language-Action Models

353

03 Nov 2025

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

31 Oct 2025

A Step Toward World Models: A Survey on Robotic Manipulation

757

31 Oct 2025

DeepThinkVLA: Enhancing Reasoning Capability of Vision-Language-Action Models

188

31 Oct 2025