Referring Multi-Object Tracking

6 March 2023

Xiangyu Zhang

Papers citing "Referring Multi-Object Tracking"

50 / 56 papers shown

Title
DriveSOTIF: Advancing Perception SOTIF Through Multimodal Large Language Models Shucheng Huang Freda Shi Chen Sun Jiaming Zhong Minghao Ning Yufeng Yang Yukun Lu Hong Wang A. Khajepour 16 0 0 11 May 2025
ReferGPT: Towards Zero-Shot Referring Multi-Object Tracking Tzoulio Chamiti Leandro Di Bella Adrian Munteanu Nikos Deligiannis 24 0 0 12 Apr 2025
NuGrounding: A Multi-View 3D Visual Grounding Framework in Autonomous Driving Fuhao Li Huan Jin Bin-Bin Gao Liaoyuan Fan Lihui Jiang Long Zeng 63 0 0 28 Mar 2025
ChatBEV: A Visual Language Model that Understands BEV Maps Qingyao Xu S. Chen Guang Chen Yanfeng Wang Y. Zhang 39 0 0 18 Mar 2025
Dynamic Derivation and Elimination: Audio Visual Segmentation with Enhanced Audio Semantics Chen Liu Liying Yang Peike Li Dadong Wang Lincheng Li Xin Yu VOS 94 0 0 17 Mar 2025
OVTR: End-to-End Open-Vocabulary Multiple Object Tracking with Transformer Jinyang Li En Yu Sijia Chen Wenbing Tao 45 1 0 13 Mar 2025
Talk2PC: Enhancing 3D Visual Grounding through LiDAR and Radar Point Clouds Fusion for Autonomous Driving Runwei Guan Jianan Liu Ningwei Ouyang Daizong Liu Xiaolou Sun Lianqing Zheng Ming Xu Yutao Yue Hui Xiong 61 1 0 11 Mar 2025
CPAny: Couple With Any Encoder to Refer Multi-Object Tracking Weize Li Yunhao Du Qixiang Yin Zhicheng Zhao Fei Su Daqi Liu 59 0 0 10 Mar 2025
GuardDoor: Safeguarding Against Malicious Diffusion Editing via Protective Backdoors Yaopei Zeng Yuanpu Cao Lu Lin DiffM WIGM 60 0 0 05 Mar 2025
VLM-E2E: Enhancing End-to-End Autonomous Driving with Multimodal Driver Attention Fusion Pei Liu Haipeng Liu Haichao Liu Xin Liu Jinxin Ni Jun Ma 58 0 0 25 Feb 2025
MEX: Memory-efficient Approach to Referring Multi-Object Tracking Huu-Thien Tran Phuoc-Sang Pham Thai-Son Tran Khoa Luu VOT 67 1 0 20 Feb 2025
Embodied Scene Understanding for Vision Language Models via MetaVQA Weizhen Wang Chenda Duan Zhenghao Peng Yuxin Liu Bolei Zhou LM&Ro 44 0 0 17 Jan 2025
DriveLM: Driving with Graph Visual Question Answering Chonghao Sima Katrin Renz Kashyap Chitta L. Chen Hanxue Zhang Chengen Xie Jens Beißwenger Ping Luo Andreas Geiger Hongyang Li 75 159 0 17 Jan 2025
Vitron: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing Hao Fei Shengqiong Wu H. Zhang Tat-Seng Chua Shuicheng Yan 56 35 0 31 Dec 2024
Towards Visual Grounding: A Survey Linhui Xiao Xiaoshan Yang X. Lan Yaowei Wang Changsheng Xu ObjD 44 3 0 31 Dec 2024
Senna: Bridging Large Vision-Language Models and End-to-End Autonomous Driving Bo Jiang Shaoyu Chen Bencheng Liao Xingyu Zhang Wei Yin Qian Zhang Chang Huang W. Liu X. Wang VLM MLLM LRM 35 12 0 29 Oct 2024
Temporal-Enhanced Multimodal Transformer for Referring Multi-Object Tracking and Segmentation Changcheng Xiao Qiong Cao Yujie Zhong Xiang Zhang Tao Wang Canqun Yang L. Lan 15 0 0 17 Oct 2024
Multiview Scene Graph Juexiao Zhang Gao Zhu Sihang Li Xinhao Liu Haorui Song Xinran Tang Chen Feng 3DV 18 1 0 15 Oct 2024
DINTR: Tracking via Diffusion-based Interpolation Pha Nguyen Ngan Le J. Cothren Alper Yilmaz Khoa Luu DiffM 35 0 0 14 Oct 2024
MCTrack: A Unified 3D Multi-Object Tracking Framework for Autonomous Driving Xiyang Wang Shouzheng Qi Jieyou Zhao Hangning Zhou Siyu Zhang ... Kai Tu Songlin Guo Jianbo Zhao Jian Li Mu Yang VOT 37 4 0 23 Sep 2024
ActionVOS: Actions as Prompts for Video Object Segmentation Liangyang Ouyang Ruicong Liu Yifei Huang Ryosuke Furuta Yoichi Sato VOS 31 2 0 10 Jul 2024
LaMOT: Language-Guided Multi-Object Tracking Yunhao Li Xiaoqiong Liu Luke Liu Heng Fan Libo Zhang VOT 18 1 0 12 Jun 2024
Bootstrapping Referring Multi-Object Tracking Yani Zhang Dongming Wu Wencheng Han Xingping Dong 37 5 0 07 Jun 2024
Talk to Parallel LiDARs: A Human-LiDAR Interaction Method Based on 3D Visual Grounding Yuhang Liu Boyi Sun Guixu Zheng Yishuo Wang Jing Wang Fei-Yue Wang 29 2 0 24 May 2024
Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension Runwei Guan Ruixiao Zhang Ningwei Ouyang Jianan Liu Ka Lok Man ... Ming Xu Jeremy S. Smith Eng Gee Lim Yutao Yue Hui Xiong 46 8 0 21 May 2024
MLS-Track: Multilevel Semantic Interaction in RMOT Zeliang Ma Yang Song Zhe Cui Zhicheng Zhao Fei Su Delong Liu Jingyu Wang 28 4 0 18 Apr 2024
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar Runwei Guan Liye Jia Fengyufan Yang Shanliang Yao Erick Purwanto ... Eng Gee Lim Jeremy S. Smith Ka Lok Man Xuming Hu Yutao Yue 32 8 0 19 Mar 2024
EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving Jiacheng Lin Jiajun Chen Kunyu Peng Xuan He Zhiyong Li Rainer Stiefelhagen Kailun Yang 48 6 0 28 Feb 2024
DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models Xiaoyu Tian Junru Gu Bailin Li Yicheng Liu Yang Wang Chenxu Hu Kun Zhan Peng Jia Xianpeng Lang Hang Zhao VLM 65 122 0 19 Feb 2024
Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives Sheng Luo Wei-Neng Chen Wanxin Tian Rui Liu Luanxuan Hou ... Ling Shao Yi Yang Bojun Gao Qun Li Guobin Wu 47 3 0 05 Feb 2024
A Survey on Autonomous Driving Datasets: Statistics, Annotation Quality, and a Future Outlook Mingyu Liu Ekim Yurtsever Jonathan Fossaert Xingcheng Zhou Walter Zimmer Yuning Cui B. L. Žagar Alois C. Knoll 40 34 0 02 Jan 2024
Holistic Autonomous Driving Understanding by Bird's-Eye-View Injected Multi-Modal Large Models Xinpeng Ding Jinahua Han Hang Xu Xiaodan Liang Wei Zhang Xiaomeng Li 12 38 0 02 Jan 2024
iKUN: Speak to Trackers without Retraining Yunhao Du Cheng Lei Zhicheng Zhao Fei Su VOT 10 4 0 25 Dec 2023
Prospective Role of Foundation Models in Advancing Autonomous Vehicles Jianhua Wu B. Gao Jincheng Gao Jianhao Yu Hongqing Chu ... Xun Gong Yi Chang H. E. Tseng Hong Chen Jie Chen 31 3 0 08 Dec 2023
Towards Knowledge-driven Autonomous Driving Xin Li Yeqi Bai Pinlong Cai Licheng Wen Daocheng Fu ... Yikang Li Botian Shi Yong-Jin Liu Liang He Yu Qiao 32 26 0 07 Dec 2023
Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving Ming-Jun Nie Renyuan Peng Chunwei Wang Xinyue Cai Jianhua Han Hang Xu Li Zhang LRM 21 44 0 06 Dec 2023
SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation Bin Xie Jiale Cao Jin Xie Fahad Shahbaz Khan Yanwei Pang VLM 18 42 0 27 Nov 2023
Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking Yizhe Li Sanping Zhou Zheng Qin Le Wang Jinjun Wang Nanning Zheng 27 1 0 17 Nov 2023
Vision Language Models in Autonomous Driving: A Survey and Outlook Xingcheng Zhou Mingyu Liu Ekim Yurtsever B. L. Žagar Walter Zimmer Hu Cao Alois C. Knoll VLM 15 33 0 22 Oct 2023
Talk2BEV: Language-enhanced Bird's-eye View Maps for Autonomous Driving Tushar Choudhary Vikrant Dewangan Shivam Chandhok Shubham Priyadarshan Anushka Jain A. K. Singh Siddharth Srivastava Krishna Murthy Jatavallabhula K. M. Krishna 26 57 0 03 Oct 2023
DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions Teng Fu Xiaocong Wang Haiyang Yu Ke Niu Bin Li Xiangyang Xue VOT ViT 23 6 0 09 Sep 2023
Language Prompt for Autonomous Driving Dongming Wu Wencheng Han Tiancai Wang Yingfei Liu Cheng-zhong Xu Jianbing Shen Jianbing Shen VLM 27 71 0 08 Sep 2023
ASY-VRNet: Waterway Panoptic Driving Perception Model based on Asymmetric Fair Fusion of Vision and 4D mmWave Radar Runwei Guan Shanliang Yao Xiaohui Zhu Ka Lok Man Yong Yue Jeremy S. Smith Eng Gee Lim Yutao Yue 19 9 0 20 Aug 2023
Visual and Textual Prior Guided Mask Assemble for Few-Shot Segmentation and Beyond Chen Shuai Meng Fanman Runtong Zhang Heqian Qiu Hongliang Li Wu Qingbo Xu Linfeng VLM 17 12 0 15 Aug 2023
OnlineRefer: A Simple Online Baseline for Referring Video Object Segmentation Dongming Wu Tiancai Wang Yuang Zhang Xiangyu Zhang Jianbing Shen VOS 16 33 0 18 Jul 2023
The 1st-place Solution for CVPR 2023 OpenLane Topology in Autonomous Driving Challenge Dongming Wu Fan Jia Jiahao Chang Zhuoling Li Jian‐Yuan Sun Chunrui Han Shuailin Li Yingfei Liu Zheng Ge Tiancai Wang 3DPC 12 11 0 16 Jun 2023
NuScenes-QA: A Multi-modal Visual Question Answering Benchmark for Autonomous Driving Scenario Tianwen Qian Jingjing Chen Linhai Zhuo Yang Jiao Yueping Jiang 10 131 0 24 May 2023
Type-to-Track: Retrieve Any Object via Prompt-based Tracking Pha Nguyen Kha Gia Quach Kris M. Kitani Khoa Luu 19 17 0 22 May 2023
Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection Shihao Wang Yingfei Liu Tiancai Wang Ying Li Xiangyu Zhang 3DPC 30 188 0 21 Mar 2023
PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images Yingfei Liu Junjie Yan Fan Jia Shuailin Li Q. Gao Tiancai Wang X. Zhang Jian-jun Sun 3DPC 13 338 0 02 Jun 2022