Title
Pixel Motion as Universal Representation for Robot Control Kanchana Ranasinghe Xiang Li Cristina Mata J. Park Michael S. Ryoo VGen 18 0 0 12 May 2025
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments Pranav Guruprasad Yangyue Wang Sudipta Chowdhury Harshvardhan Sikka LM&Ro VLM 67 0 0 08 May 2025
UniCO: Towards a Unified Model for Combinatorial Optimization Problems Zefang Zong Xiaochen Wei Guozhen Zhang Chen Gao Huandong Wang Yong Li 14 0 0 07 May 2025
A Survey of Interactive Generative Video Jiwen Yu Yiran Qin Haoxuan Che Quande Liu X. Wang Pengfei Wan Di Zhang Kun Gai Hao Chen Xihui Liu VGen 53 0 0 30 Apr 2025
RL-Driven Data Generation for Robust Vision-Based Dexterous Grasping Atsushi Kanehira Naoki Wake Kazuhiro Sasabuchi Jun Takamatsu Katsushi Ikeuchi 37 0 0 25 Apr 2025
State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements Wonjin Song Feng Bao 26 0 0 10 Apr 2025
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers Jake Grigsby Yuqi Xie Justin Sasek Steven Zheng Yuke Zhu OffRL 26 0 0 06 Apr 2025
Dexterous Manipulation through Imitation Learning: A Survey Shan An Ziyu Meng Chao Tang Y. Zhou Tengyu Liu ... Yao Mu Ran Song Wei Zhang Zeng-Guang Hou H. Zhang 40 0 0 04 Apr 2025
Towards Unified Referring Expression Segmentation Across Omni-Level Visual Target Granularities Jing Liu Wenxuan Wang Yisi Zhang Yepeng Tang Xingjian He Longteng Guo Tongtian Yue Xinlong Wang ObjD 40 0 0 02 Apr 2025
Latent Embedding Adaptation for Human Preference Alignment in Diffusion Planners Wen Zheng Terence Ng Jianda Chen Yuan Xu Tianwei Zhang 37 0 0 24 Mar 2025
AdaWorld: Learning Adaptable World Models with Latent Actions Shenyuan Gao Siyuan Zhou Yilun Du Jun Zhang Chuang Gan VGen 54 3 0 24 Mar 2025
Position: Interactive Generative Video as Next-Generation Game Engine Jiwen Yu Yiran Qin Haoxuan Che Quande Liu Xintao Wang Pengfei Wan Di Zhang Xihui Liu VGen 45 1 0 21 Mar 2025
Unified Locomotion Transformer with Simultaneous Sim-to-Real Transfer for Quadrupeds Dikai Liu Tianwei Zhang Jianxiong Yin Simon See OffRL 55 0 0 13 Mar 2025
Masked Sensory-Temporal Attention for Sensor Generalization in Quadruped Locomotion Dikai Liu Tianwei Zhang Jianxiong Yin Simon See 82 1 0 13 Mar 2025
VLA Model-Expert Collaboration for Bi-directional Manipulation Learning Tian-Yu Xiang Ao-Qun Jin Xiao-Hu Zhou Mei-Jiang Gui Xiao-Liang Xie ... Shuang-Yi Wang Sheng-Bin Duang Si-Cheng Wang Zheng Lei Z. Hou 55 1 0 06 Mar 2025
Refined Policy Distillation: From VLA Generalists to RL Experts Tobias Jülg Wolfram Burgard Florian Walter OffRL 34 1 0 06 Mar 2025
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Safe Reinforcement Learning Borong Zhang Yuhao Zhang Jiaming Ji Yingshan Lei Josef Dai Yuanpei Chen Yaodong Yang 63 3 0 05 Mar 2025
MA-LoT: Multi-Agent Lean-based Long Chain-of-Thought Reasoning enhances Formal Theorem Proving Ruida Wang Rui Pan Yuxin Li Jipeng Zhang Yizhen Jia Shizhe Diao Renjie Pi Junjie Hu Tong Zhang LRM LLMAG 76 5 0 05 Mar 2025
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction Huang Huang Fangchen Liu Letian Fu Tingfan Wu Mustafa Mukadam Jitendra Malik Ken Goldberg Pieter Abbeel LM&Ro VLM 74 4 0 05 Mar 2025
A Shared Encoder Approach to Multimodal Representation Learning Shuvendu Roy Franklin Ogidi Ali Etemad Elham Dolatabadi Arash Afkanpour 36 0 0 03 Mar 2025
Discrete Codebook World Models for Continuous Control Aidan Scannell Mohammadreza Nakhaei Kalle Kujanpää Yi Zhao Kevin Sebastian Luck Arno Solin J. Pajarinen OffRL 47 0 0 01 Mar 2025
Agentic AI Needs a Systems Theory Erik Miehling K. Ramamurthy Kush R. Varshney Matthew D Riemer Djallel Bouneffouf ... P. Sattigeri Dennis L. Wei Ambrish Rawat Jasmina Gajcin Werner Geyer 66 1 0 28 Feb 2025
Digital Player: Evaluating Large Language Models based Human-like Agent in Games J. T. Wang Kai Wang Shaojie Lin Runze Wu Bihan Xu ... Zhipeng Hu Z. Fan Le Li Tangjie Lyu Changjie Fan LLMAG ELM AI4CE 53 1 0 28 Feb 2025
Distilling Reinforcement Learning Algorithms for In-Context Model-Based Planning Jaehyeon Son Soochan Lee Gunhee Kim OffRL 64 1 0 26 Feb 2025
Generalist World Model Pre-Training for Efficient Reinforcement Learning Yi Zhao Aidan Scannell Yuxin Hou Tianyu Cui Le Chen Dieter Buchler Arno Solin Juho Kannala J. Pajarinen OffRL OnRL 73 1 0 26 Feb 2025
GraphBridge: Towards Arbitrary Transfer Learning in GNNs Li Ju Xingyi Yang Qi Li Xinchao Wang 42 0 0 26 Feb 2025
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents Taiyi Wang Zhihao Wu Jianheng Liu Jianye Hao J. Wang Kun Shao OffRL 34 13 0 24 Feb 2025
Teleology-Driven Affective Computing: A Causal Framework for Sustained Well-Being Bin Yin Chong-Yi Liu Liya Fu Jinkun Zhang AI4TS 38 1 0 24 Feb 2025
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter G. Klambauer Razvan Pascanu Sepp Hochreiter 70 4 0 21 Feb 2025
Video2Policy: Scaling up Manipulation Tasks in Simulation through Internet Videos Weirui Ye Fangchen Liu Z. Ding Yang Gao Oleh Rybkin Pieter Abbeel VGen OffRL 78 1 0 14 Feb 2025
Diverse Transformer Decoding for Offline Reinforcement Learning Using Financial Algorithmic Approaches D. Elbaz Oren Salzman OffRL 32 0 0 13 Feb 2025
Privacy-Preserving Dataset Combination Keren Fuentes Mimee Xu Irene Chen 36 0 0 09 Feb 2025
Imitation Game for Adversarial Disillusion with Multimodal Generative Chain-of-Thought Role-Play Ching-Chun Chang Fan-Yun Chen Shih-Hong Gu Kai Gao Hanrui Wang Isao Echizen AAML 64 0 0 31 Jan 2025
Towards General-Purpose Model-Free Reinforcement Learning Scott Fujimoto P. DÓro Amy Zhang Yuandong Tian Michael Rabbat OffRL 34 3 0 28 Jan 2025
Human-like Bots for Tactical Shooters Using Compute-Efficient Sensors Niels Justesen Maria Kaselimi Sam Snodgrass Miruna Vozaru Matthew Schlegel ... Albert Wang Christoffer Holmgård Georgios N. Yannakakis S. Risi Julian Togelius 39 0 0 03 Jan 2025
Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform Cheonsu Jeong 70 0 0 01 Jan 2025
Environment Descriptions for Usability and Generalisation in Reinforcement Learning Dennis J. N. J. Soemers Spyridon Samothrakis Kurt Driessens M. Winands OffRL 70 0 0 22 Dec 2024
Future Research Avenues for Artificial Intelligence in Digital Gaming: An Exploratory Report Markus Dablander 73 0 0 18 Dec 2024
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models Xinghang Li Peiyan Li Minghuan Liu Dong Wang Jirong Liu Bingyi Kang Xiao Ma Tao Kong Hanbo Zhang Huaping Liu LM&Ro 88 14 0 18 Dec 2024
Challenges in Human-Agent Communication Gagan Bansal J. W. Vaughan Saleema Amershi Eric Horvitz Adam Fourney Hussein Mozannar Victor C. Dibia Daniel S. Weld LLMAG AAML AI4CE 78 4 0 28 Nov 2024
Transformer-based Heuristic for Advanced Air Mobility Planning Jun Xiang Jun Chen 64 0 0 21 Nov 2024
Tra-MoE: Learning Trajectory Prediction Model from Multiple Domains for Adaptive Policy Conditioning Jiange Yang Haoyi Zhu Y. Wang Gangshan Wu Tong He Limin Wang 89 2 0 21 Nov 2024
I Can Tell What I am Doing: Toward Real-World Natural Language Grounding of Robot Experiences Zihan Wang Brian Liang Varad Dhat Zander Brumbaugh Nick Walker Ranjay Krishna Maya Cakmak 59 4 0 20 Nov 2024
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games Davide Paglieri Bartłomiej Cupiał Samuel Coward Ulyana Piterbarg Maciej Wolczyk ... Lerrel Pinto Rob Fergus Jakob Foerster Jack Parker-Holder Tim Rocktaschel LLMAG LRM 101 10 0 20 Nov 2024
AMAGO-2: Breaking the Multi-Task Barrier in Meta-Reinforcement Learning with Transformers Jake Grigsby Justin Sasek Samyak Parajuli Daniel Adebi Amy Zhang Yuke Zhu OffRL 20 2 0 17 Nov 2024
Generalist Virtual Agents: A Survey on Autonomous Agents Across Digital Platforms Minghe Gao Wendong Bu Bingchen Miao Yang Wu Yunfei Li Juncheng Billy Li Siliang Tang Qi Wu Yueting Zhuang Meng Wang LM&Ro 33 3 0 17 Nov 2024
ClevrSkills: Compositional Language and Visual Reasoning in Robotics Sanjay Haresh Daniel Dijkman Apratim Bhattacharyya Roland Memisevic CoGe LRM 25 1 0 13 Nov 2024
DART-LLM: Dependency-Aware Multi-Robot Task Decomposition and Execution using Large Language Models Yongdong Wang Runze Xiao Jun Younes Louhi Kasahara Ryosuke Yajima Keiji Nagatani Atsushi Yamashita Hajime Asama 23 2 0 13 Nov 2024
World Models: The Safety Perspective Zifan Zeng Chongzhe Zhang Feng Liu Joseph Sifakis Qunli Zhang Shiming Liu Peng Wang KELM LLMAG 40 1 0 12 Nov 2024
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks Adam Fourney Gagan Bansal Hussein Mozannar Cheng Tan Eduardo Salinas ... Victor C. Dibia Ahmed Hassan Awadallah Ece Kamar Rafah Hosn Saleema Amershi AI4CE LRM LLMAG 38 34 0 07 Nov 2024