v1v2 (latest)

Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks

24 October 2018

Silvio Savarese

Li Fei-Fei

Papers citing "Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks"

50 / 219 papers shown

Title
VT-Refine: Learning Bimanual Assembly with Visuo-Tactile Feedback via Simulation Fine-Tuning Binghao Huang Jie Xu Iretiayo Akinola Wei Yang Balakumar Sundaralingam ... Dieter Fox Xiaolong Wang Arsalan Mousavian Yu-Wei Chao Yunzhu Li 70 3 0 16 Oct 2025
Expressive and Scalable Quantum Fusion for Multimodal Learning T. Nguyen Trong Nghia Hoang Phi Le Nguyen Hai L. Vu Truong Cong Thang 48 0 0 08 Oct 2025
Best of Sim and Real: Decoupled Visuomotor Manipulation via Learning Control in Simulation and Perception in Real Jialei Huang Zhaoheng Yin Yingdong Hu S. Wang Xingyu Lin Yang Gao 28 0 0 30 Sep 2025
MAESTRO : Adaptive Sparse Attention and Robust Learning for Multimodal Dynamic Time Series Payal Mohapatra Yueyuan Sui Akash Pandey Stephen Xia Qi Zhu AI4TS 21 1 0 29 Sep 2025
Disentanglement of Variations with Multimodal Generative Modeling Yijie Zhang Yiyang Shen Weiran Wang 20 0 0 28 Sep 2025
Multi-Modal Manipulation via Multi-Modal Policy Consensus Haonan Chen Jiaming Xu Hongyu Chen Kaiwen Hong Binghao Huang Chaoqi Liu Jiayuan Mao Yunzhu Li Yilun Du Katherine Driggs-Campbell 50 0 0 27 Sep 2025
DexSkin: High-Coverage Conformable Robotic Skin for Learning Contact-Rich Manipulation Suzannah Wistreich Baiyu Shi Stephen Tian Samuel Clarke Michael Nath Chengyi Xu Zhenan Bao Jiajun Wu 41 0 0 23 Sep 2025
Force-Modulated Visual Policy for Robot-Assisted Dressing with Arm Motions Alexis Yihong Hao Yufei Wang Navin Sriram Ravie Bharath Hegde David Held Zackory M. Erickson 40 0 0 16 Sep 2025
Igniting VLMs toward the Embodied Space Andy Zhai B. Liu Bruno Fang Chalse Cai Ellie Ma ... Shalfun Li Starrick Liu S. Chen Vincent Chen Zach Xu LM&Ro VLM 43 3 0 15 Sep 2025
A Semi-supervised Generative Model for Incomplete Multi-view Data Integration with Missing Labels Yiyang Shen Weiran Wang 36 0 0 15 Aug 2025
Exploring the Link Between Bayesian Inference and Embodied Intelligence: Toward Open Physical-World Embodied AI Systems Bin Liu 128 0 0 29 Jul 2025
Touch in the Wild: Learning Fine-Grained Manipulation with a Portable Visuo-Tactile Gripper Xinyue Zhu Binghao Huang Yunzhu Li 77 5 0 20 Jul 2025
The Sound of Simulation: Learning Multimodal Sim-to-Real Robot Policies with Generative Audio Renhao Wang Haoran Geng Tingle Li Feishi Wang Gopala Anumanchipalli Trevor Darrell Boyi Li Pieter Abbeel Jitendra Malik Alexei A. Efros VGen 106 0 0 03 Jul 2025
RoHyDR: Robust Hybrid Diffusion Recovery for Incomplete Multimodal Emotion Recognition Yuehan Jin Xiaoqing Liu Yiyuan Yang Zhiwen Yu Tong Zhang Kaixiang Yang DiffM 91 0 0 23 May 2025
Adaptive Visuo-Tactile Fusion with Predictive Force Attention for Dexterous Manipulation Jinzhou Li Tianhao Wu Jiyao Zhang Zeyuan Chen Haotian Jin Mingdong Wu Yujun Shen Yaodong Yang Hao Dong 180 2 0 20 May 2025
Force-Driven Validation for Collaborative Robotics in Automated Avionics Testing Pietro Dardano Paolo Rocco David Frisini 81 0 0 15 May 2025
Visual Affordance Prediction: Survey and Reproducibility Tommaso Apicella Alessio Xompero Andrea Cavallaro 235 0 0 08 May 2025
BQSched: A Non-intrusive Scheduler for Batch Concurrent Queries via Reinforcement LearningIEEE International Conference on Data Engineering (ICDE), 2025 Chenhao Xu Chunyu Chen Jinglin Peng Jiannan Wang Jun Gao OffRL AI4TS 129 0 0 27 Apr 2025
Grasping Deformable Objects via Reinforcement Learning with Cross-Modal Attention to Visuo-Tactile Inputs Yonghyun Lee Sungeun Hong Min-gu Kim Gyeonghwan Kim Changjoo Nam 144 2 0 22 Apr 2025
Towards Forceful Robotic Foundation Models: a Literature Survey William Xie N. Correll OffRL 188 5 0 16 Apr 2025
ViTaMIn: Learning Contact-Rich Tasks Through Robot-Free Visuo-Tactile Manipulation Interface Fangchen Liu Chuanyu Li Yihua Qin Ankit Shaw Jinfeng Xu Pieter Abbeel 274 12 0 08 Apr 2025
IMPACT: Intelligent Motion Planning with Acceptable Contact Trajectories via Vision-Language Models Yiyang Ling Karan Owalekar Oluwatobiloba Adesanya Erdem Bıyık Daniel Seita 186 4 0 13 Mar 2025
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model Jiaming Liu Hao Chen Pengju An Zhuoyang Liu Renrui Zhang ... Chengkai Hou Mengdi Zhao KC alex Zhou Pheng-Ann Heng Shanghang Zhang 380 73 0 13 Mar 2025
A Taxonomy for Evaluating Generalist Robot Policies Jensen Gao Suneel Belkhale Sudeep Dasari Ashwin Balakrishna Dhruv Shah Dorsa Sadigh LM&Ro 177 17 0 03 Mar 2025
DeepSuM: Deep Sufficient Modality Learning Framework Zhe Gao Jian Huang Ting Li Xueqin Wang 103 0 0 03 Mar 2025
Cross-domain Few-shot Object Detection with Multi-modal Textual Enrichment Zeyu Shangguan Daniel Seita Mohammad Rostami ObjD 200 0 0 23 Feb 2025
Understanding the Emergence of Multimodal Representation Alignment Megan Tjandrasuwita Chanakya Ekbote Liu Ziyin Paul Pu Liang 188 10 0 22 Feb 2025
3D-ViTac: Learning Fine-Grained Manipulation with Visuo-Tactile SensingConference on Robot Learning (CoRL), 2024 Binghao Huang Yixuan Wang Xinyi Yang Yiyue Luo Yunzhu Li 251 52 0 08 Jan 2025
ORGANA: A Robotic Assistant for Automated Chemistry Experimentation and Characterization Kourosh Darvish Marta Skreta Yuchi Zhao Naruki Yoshikawa Sagnik Som ... Han Hao Haoping Xu Alán Aspuru-Guzik Animesh Garg Florian Shkurti 189 74 0 08 Jan 2025
Learning Visuotactile Estimation and Control for Non-prehensile Manipulation under OcclusionsConference on Robot Learning (CoRL), 2024 Juan Del Aguila Ferrandis João Moura S. Vijayakumar 231 7 0 17 Dec 2024
Learned Slip-Detection-Severity Framework using Tactile Deformation Field Feedback for Robotic ManipulationIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024 Neel Jawale Navneet Kaur Amy Santoso Xiaohai Hu Xu Chen 96 5 0 11 Nov 2024
Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot PerceptionThe international journal of robotics research (IJRR), 2024 Gaotian Wang Kejia Ren A. S. Morgan Kaiyu Hang 260 4 0 21 Oct 2024
AugInsert: Learning Robust Visual-Force Policies via Data Augmentation for Object Assembly Tasks Ryan Diaz Adam Imdieke Vivek Veeriah Karthik Desingh 167 0 0 19 Oct 2024
Contrastive Touch-to-Touch PretrainingIEEE International Conference on Robotics and Automation (ICRA), 2024 Samanta Rodriguez Yiming Dou W. V. D. Bogert Miquel Oller Kevin So Andrew Owens Nima Fazeli 158 4 0 15 Oct 2024
RDT-1B: a Diffusion Foundation Model for Bimanual ManipulationInternational Conference on Learning Representations (ICLR), 2024 Songming Liu Lingxuan Wu Bangguo Li Hengkai Tan Huayu Chen Zhengyi Wang Ke Xu Hang Su Jun Zhu 247 282 0 10 Oct 2024
All Robots in One: A New Standard and Unified Dataset for Versatile, General-Purpose Embodied Agents Zhiqiang Wang Hao Zheng Yunshuang Nie Wenjun Xu Qingwei Wang ... Wanxi Dong Chang Cai Liang Lin Feng Zheng Xiaodan Liang 117 11 0 20 Aug 2024
Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification P. Zyblewski Leandro L. Minku 130 1 0 05 Aug 2024
Play to the Score: Stage-Guided Dynamic Multi-Sensory Fusion for Robotic ManipulationConference on Robot Learning (CoRL), 2024 Runze Yuan Tao Liu Wenke Ma Xuelong Li 159 11 0 02 Aug 2024
Revisiting Sparse Rewards for Goal-Reaching Reinforcement Learning Gautham Vasan Yan Wang Fahim Shahriar James Bergstra Martin Jägersand A. R. Mahmood 156 8 0 29 Jun 2024
ManiWAV: Learning Robot Manipulation from In-the-Wild Audio-Visual Data Zeyi Liu Cheng Chi Eric A. Cousineau Naveen Kuppuswamy Benjamin Burchfiel Shuran Song VGen 176 41 0 27 Jun 2024
RVT-2: Learning Precise Manipulation from Few Demonstrations Ankit Goyal Valts Blukis Jie Xu Yijie Guo Yu-Wei Chao Dieter Fox 181 110 0 12 Jun 2024
A Practical Roadmap to Learning from Demonstration for Robotic Manipulators in Manufacturing Alireza Barekatain Hamed Habibi Holger Voos 130 7 0 11 Jun 2024
iVideoGPT: Interactive VideoGPTs are Scalable World Models Jialong Wu Shaofeng Yin Ningya Feng Xu He Dong Li Haifeng Zhang Mingsheng Long VGen 191 69 0 24 May 2024
Hearing Touch: Audio-Visual Pretraining for Contact-Rich ManipulationIEEE International Conference on Robotics and Automation (ICRA), 2024 Jared Mejia Victoria Dean Tess Hellebrekers Abhinav Gupta 155 17 0 14 May 2024
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly Hao-ming Lin Radu Corcodel Ding Zhao 192 12 0 26 Apr 2024
Cross-domain Multi-modal Few-shot Object Detection via Rich TextIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024 Zeyu Shangguan Daniel Seita Mohammad Rostami ObjD 254 1 0 24 Mar 2024
Zero-shot cross-modal transfer of Reinforcement Learning policies through a Global Workspace Léopold Maytié Benjamin Devillers Alexandre Arnold R. V. Rullen OffRL 138 1 0 07 Mar 2024
Feel the Bite: Robot-Assisted Inside-Mouth Bite Transfer using Robust Mouth Perception and Physical Interaction-Aware Control Rajat Kumar Jenamani Daniel Stabile Ziang Liu Abrar Anwar Katherine Dimitropoulou Tapomayukh Bhattacharjee 162 25 0 06 Mar 2024
Multimodal Anomaly Detection based on Deep Auto-Encoder for Object Slip Perception of Mobile Manipulation Robots Youngjae Yoo Chung-yeon Lee Byoung-Tak Zhang 95 14 0 06 Mar 2024
Symmetry-aware Reinforcement Learning for Robotic Assembly under Partial Observability with a Soft Wrist Hai Nguyen Tadashi Kozuno C. C. Beltran-Hernandez Masashi Hamaya 240 10 0 28 Feb 2024