VARP: Reinforcement Learning from Vision-Language Model Feedback with Agent Regularized Preferences

18 March 2025

Papers citing "VARP: Reinforcement Learning from Vision-Language Model Feedback with Agent Regularized Preferences"

3 / 3 papers shown

Title
Cross-Modal Instructions for Robot Motion Generation William Barron Xiaoxiang Dong Matthew Johnson-Roberson Weiming Zhi 72 0 0 25 Sep 2025
Perception-Aware Policy Optimization for Multimodal Reasoning Zhenhailong Wang Xuehang Guo Sofia Stoica Haiyang Xu Hongru Wang ... Xiusi Chen Yangyi Chen Ming Yan Fei Huang Mengyue Yang OffRL LRM 320 12 0 08 Jul 2025
Sketch-to-Skill: Bootstrapping Robot Learning with Human Drawn Trajectory Sketches Peihong Yu Amisha Bhaskar Anukriti Singh Zahiruddin Mahammad Erfaun Noorani 181 6 0 14 Mar 2025