Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2406.09246
Cited By

OpenVLA: An Open-Source Vision-Language-Action Model

v1v2 (latest)

OpenVLA: An Open-Source Vision-Language-Action Model

13 June 2024

Siddharth Karamcheti

Ashwin Balakrishna

Rafael Rafailov

Ethan P. Foster

Pannag R Sanketi

Quan Vuong

Benjamin Burchfiel

Dorsa Sadigh

Percy Liang

Chelsea Finn

ArXiv (abs)PDF HTML HuggingFace (40 upvotes)

Papers citing "OpenVLA: An Open-Source Vision-Language-Action Model"

50 / 723 papers shown

COMMET: A System for Human-Induced Conflicts in Mobile Manipulation of Everyday Tasks

COMMET: A System for Human-Induced Conflicts in Mobile Manipulation of Everyday Tasks

Katherine Rose Driggs-Campbell

117

0

0

05 Sep 2025

FLOWER: Democratizing Generalist Robot Policies with Efficient Vision-Language-Action Flow Policies

FLOWER: Democratizing Generalist Robot Policies with Efficient Vision-Language-Action Flow Policies

Ömer Erdinç Yagmurlu

Rudolf Lioutikov

179

17

0

05 Sep 2025

FPC-VLA: A Vision-Language-Action Framework with a Supervisor for Failure Prediction and Correction

FPC-VLA: A Vision-Language-Action Framework with a Supervisor for Failure Prediction and Correction

...

218

6

0

04 Sep 2025

RL's Razor: Why Online Reinforcement Learning Forgets Less

RL's Razor: Why Online Reinforcement Learning Forgets Less

194

43

0

04 Sep 2025

Long-Horizon Visual Imitation Learning via Plan and Code Reflection

Long-Horizon Visual Imitation Learning via Plan and Code Reflection

175

1

0

04 Sep 2025

EMMA: Scaling Mobile Manipulation via Egocentric Human Data

EMMA: Scaling Mobile Manipulation via Egocentric Human Data

Lawrence Y. Zhu

Patcharapong Aphiwetsa

155

6

0

04 Sep 2025

Balancing Signal and Variance: Adaptive Offline RL Post-Training for VLA Flow Models

Balancing Signal and Variance: Adaptive Offline RL Post-Training for VLA Flow Models

142

6

0

04 Sep 2025

ANNIE: Be Careful of Your Robots

ANNIE: Be Careful of Your Robots

147

0

0

03 Sep 2025

OmniActor: A Generalist GUI and Embodied Agent for 2D&3D Worlds

OmniActor: A Generalist GUI and Embodied Agent for 2D&3D Worlds

141

3

0

02 Sep 2025

U-ARM : Ultra low-cost general teleoperation interface for robot manipulation

U-ARM : Ultra low-cost general teleoperation interface for robot manipulation

213

0

0

02 Sep 2025

Align-Then-stEer: Adapting the Vision-Language Action Models through Unified Latent Guidance

Align-Then-stEer: Adapting the Vision-Language Action Models through Unified Latent Guidance

247

6

0

02 Sep 2025

Manipulation as in Simulation: Enabling Accurate Geometry Perception in Robots

Manipulation as in Simulation: Enabling Accurate Geometry Perception in Robots

...

130

4

0

02 Sep 2025

MoTo: A Zero-shot Plug-in Interaction-aware Navigation for General Mobile Manipulation

MoTo: A Zero-shot Plug-in Interaction-aware Navigation for General Mobile Manipulation

176

3

0

01 Sep 2025

Articulated Object Estimation in the Wild

Articulated Object Estimation in the Wild

Abdelrhman Werby

Chenguang Huang

Wolfram Burgard

204

6

0

01 Sep 2025

Mechanistic interpretability for steering vision-language-action models

Mechanistic interpretability for steering vision-language-action models

Kaylene C. Stocking

175

2

0

30 Aug 2025

Galaxea Open-World Dataset and G0 Dual-System VLA Model

Galaxea Open-World Dataset and G0 Dual-System VLA Model

129

24

0

30 Aug 2025

ManipDreamer3D : Synthesizing Plausible Robotic Manipulation Video with Occupancy-aware 3D Trajectory

ManipDreamer3D : Synthesizing Plausible Robotic Manipulation Video with Occupancy-aware 3D Trajectory

Shanghang Zhang

Shanghang Zhang

378

9

0

29 Aug 2025

RoboInspector: Unveiling the Unreliability of Policy Code for LLM-enabled Robotic Manipulation

RoboInspector: Unveiling the Unreliability of Policy Code for LLM-enabled Robotic Manipulation

160

0

0

29 Aug 2025

Prompt-to-Product: Generative Assembly via Bimanual Manipulation

Prompt-to-Product: Generative Assembly via Bimanual Manipulation

Shobhit Aggarwal

...

100

0

0

28 Aug 2025

Learning Primitive Embodied World Models: Towards Scalable Robotic Learning

Learning Primitive Embodied World Models: Towards Scalable Robotic Learning

...

421

1

0

28 Aug 2025

CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification

CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification

224

23

0

28 Aug 2025

EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control

EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control

...

335

5

0

28 Aug 2025

Embodied AI: Emerging Risks and Opportunities for Policy Action

Embodied AI: Emerging Risks and Opportunities for Policy Action

Alexander Robey

Luciano Floridi

315

2

0

28 Aug 2025

Ego-centric Predictive Model Conditioned on Hand Trajectories

Ego-centric Predictive Model Conditioned on Hand Trajectories

Mike Zheng Shou

317

0

0

27 Aug 2025

Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies

Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies

...

179

30

0

27 Aug 2025

Long-VLA: Unleashing Long-Horizon Capability of Vision Language Action Model for Robot Manipulation

Long-VLA: Unleashing Long-Horizon Capability of Vision Language Action Model for Robot Manipulation

...

207

12

0

27 Aug 2025

HyperTASR: Hypernetwork-Driven Task-Aware Scene Representations for Robust Manipulation

HyperTASR: Hypernetwork-Driven Task-Aware Scene Representations for Robust Manipulation

211

1

0

26 Aug 2025

MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation

MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation

132

29

0

26 Aug 2025

SEBVS: Synthetic Event-based Visual Servoing for Robot Navigation and Manipulation

SEBVS: Synthetic Event-based Visual Servoing for Robot Navigation and Manipulation

Prithvi Jai Ramesh

Pavan Kumar B N

Bharatesh Chakravarthi

88

1

0

25 Aug 2025

HLG: Comprehensive 3D Room Construction via Hierarchical Layout Generation

HLG: Comprehensive 3D Room Construction via Hierarchical Layout Generation

Zhaoxiang Zhang

150

0

0

25 Aug 2025

FlowVLA: Visual Chain of Thought-based Motion Reasoning for Vision-Language-Action Models

FlowVLA: Visual Chain of Thought-based Motion Reasoning for Vision-Language-Action Models

...

234

3

0

25 Aug 2025

GWM: Towards Scalable Gaussian World Models for Robotic Manipulation

GWM: Towards Scalable Gaussian World Models for Robotic Manipulation

220

10

0

25 Aug 2025

From reactive to cognitive: brain-inspired spatial intelligence for embodied agents

From reactive to cognitive: brain-inspired spatial intelligence for embodied agents

163

5

0

24 Aug 2025

Robotic Manipulation via Imitation Learning: Taxonomy, Evolution, Benchmark, and Challenges

Robotic Manipulation via Imitation Learning: Taxonomy, Evolution, Benchmark, and Challenges

Alexandre Chapin

Emmanuel Dellandrea

267

3

0

24 Aug 2025

NinA: Normalizing Flows in Action. Training VLA Models with Normalizing Flows

NinA: Normalizing Flows in Action. Training VLA Models with Normalizing Flows

Alexander Nikulin

Nikita Lyubaykin

Andrei Polubarov

Alexander Derevyagin

Vladislav Kurenkov

218

2

0

23 Aug 2025

Do What? Teaching Vision-Language-Action Models to Reject the Impossible

Do What? Teaching Vision-Language-Action Models to Reject the Impossible

178

2

0

22 Aug 2025

Survey of Vision-Language-Action Models for Embodied Manipulation

Survey of Vision-Language-Action Models for Embodied Manipulation

476

4

0

21 Aug 2025

TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting

TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting

101

0

0

20 Aug 2025

The Social Context of Human-Robot Interactions

The Social Context of Human-Robot Interactions

Sydney Thompson

Marynel Vázquez

97

2

0

19 Aug 2025

CAST: Counterfactual Labels Improve Instruction Following in Vision-Language-Action Models

CAST: Counterfactual Labels Improve Instruction Following in Vision-Language-Action Models

Catherine Glossop

203

6

0

19 Aug 2025

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation

209

16

0

19 Aug 2025

Train Once, Deploy Anywhere: Realize Data-Efficient Dynamic Object Manipulation

Train Once, Deploy Anywhere: Realize Data-Efficient Dynamic Object Manipulation

Hengshuang Zhao

122

1

0

19 Aug 2025

Grounding Actions in Camera Space: Observation-Centric Vision-Language-Action Policy

Grounding Actions in Camera Space: Observation-Centric Vision-Language-Action Policy

147

3

0

18 Aug 2025

Large VLM-based Vision-Language-Action Models for Robotic Manipulation: A Survey

Large VLM-based Vision-Language-Action Models for Robotic Manipulation: A Survey

249

31

0

18 Aug 2025

Holistic Evaluation of Multimodal LLMs on Spatial Intelligence

Holistic Evaluation of Multimodal LLMs on Spatial Intelligence

...

272

0

0

18 Aug 2025

Improving Pre-Trained Vision-Language-Action Policies with Model-Based Search

Improving Pre-Trained Vision-Language-Action Policies with Model-Based Search

Artur Kuramshin

140

6

0

17 Aug 2025

Human Centric General Physical Intelligence for Agile Manufacturing Automation

Human Centric General Physical Intelligence for Agile Manufacturing Automation

Mehrdad Tavassoli

Varun Teja Chirkuri

Venkata Akhil Kumar

Santhi Bharath Punati

Praveen Damacharla

137

1

0

16 Aug 2025

OmniD: Generalizable Robot Manipulation Policy via Image-Based BEV Representation

OmniD: Generalizable Robot Manipulation Policy via Image-Based BEV Representation

105

2

0

16 Aug 2025

Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation

Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation

170

1

0

15 Aug 2025

ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving

ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving

163

2

0

15 Aug 2025

1 2 3...6 7 8...13 14 15

Page 7 of 15

Pageof 15