Title
DynamicGSG: Dynamic 3D Gaussian Scene Graphs for Environment Adaptation Luzhou Ge Xiangyu Zhu Zhuo Yang Xuesong Li 3DGS 70 0 0 21 Feb 2025
Contrastive Localized Language-Image Pre-Training Hong-You Chen Zhengfeng Lai H. Zhang X. Wang Marcin Eichner Keen You Meng Cao Bowen Zhang Y. Yang Zhe Gan CLIP VLM 68 7 0 20 Feb 2025
UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes T. Lentsch Holger Caesar D. Gavrila 3DPC 89 8 0 20 Feb 2025
Continually Learning Structured Visual Representations via Network Refinement with Rerelation Zeki Doruk Erden Boi Faltings CLL 67 0 0 20 Feb 2025
Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments Luca Barsellotti Roberto Bigazzi Marcella Cornia Lorenzo Baraldi Rita Cucchiara 87 1 0 20 Feb 2025
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image Kaixin Yao Longwen Zhang Xinhao Yan Yan Zeng Qixuan Zhang Wei Yang Lan Xu Jiayuan Gu Jingyi Yu 29 3 0 18 Feb 2025
L4P: Low-Level 4D Vision Perception Unified Abhishek Badki Hang Su Bowen Wen Orazio Gallo VLM 78 1 0 18 Feb 2025
Computational Safety for Generative AI: A Signal Processing Perspective Pin-Yu Chen 68 1 0 18 Feb 2025
Differentially Private Prototypes for Imbalanced Transfer Learning Dariush Wahdany Matthew Jagielski Adam Dziedzic Franziska Boenisch 82 0 0 17 Feb 2025
SAM-LAD: Segment Anything Model Meets Zero-Shot Logic Anomaly Detection Yun Peng Xiao Lin Nachuan Ma Jiayuan Du Chuangwei Liu Chengju Liu Qi Chen 42 3 0 17 Feb 2025
Simplifying DINO via Coding Rate Regularization Ziyang Wu Jingyuan Zhang Druv Pai X. Wang Chandan Singh Jianwei Yang Jianfeng Gao Yi-An Ma 153 1 0 17 Feb 2025
GeoDANO: Geometric VLM with Domain Agnostic Vision Encoder Seunghyuk Cho Zhenyue Qin Yang Liu Youngbin Choi Seungbeom Lee Dongwoo Kim 44 0 0 17 Feb 2025
Object-Centric Image to Video Generation with Language Guidance Angel Villar-Corrales Gjergj Plepi Sven Behnke DiffM VGen OCL 71 0 0 17 Feb 2025
Masked Latent Prediction and Classification for Self-Supervised Audio Representation Learning Aurian Quélennec Pierre Chouteau Geoffroy Peeters S. Essid SSL 52 0 0 17 Feb 2025
Hyperspherical Energy Transformer with Recurrent Depth Yunzhe Hu Difan Zou Dong Xu 41 0 0 17 Feb 2025
Without Paired Labeled Data: An End-to-End Self-Supervised Paradigm for UAV-View Geo-Localization Zhongwei Chen Zhao-Xu Yang Hai-Jun Rong SSL 56 0 0 17 Feb 2025
Dynamic Scene Understanding through Object-Centric Voxelization and Neural Rendering Yanpeng Zhao Yiwei Hao Siyu Gao Yunbo Wang Xiaokang Yang OCL 124 1 0 17 Feb 2025
TinyEmo: Scaling down Emotional Reasoning via Metric Projection Cristian Gutierrez LRM 62 0 0 17 Feb 2025
On the Statistical Complexity of Estimating Vendi Scores from Empirical Data Azim Ospanov Farzan Farnia 35 1 0 17 Feb 2025
Why Vision Language Models Struggle with Visual Arithmetic? Towards Enhanced Chart and Geometry Understanding Kung-Hsiang Huang Can Qin Haoyi Qiu Philippe Laban Shafiq R. Joty Caiming Xiong C. Wu VLM 130 1 0 17 Feb 2025
Phantom: Subject-consistent video generation via cross-modal alignment Lijie Liu Tianxiang Ma Bingchuan Li Zhuowei Chen Jiawei Liu Qian He Xinglong Wu Qian He Xinglong Wu DiffM VGen 50 5 0 16 Feb 2025
The Vendiscope: An Algorithmic Microscope For Data Collections Amey P. Pasarkar Adji Bousso Dieng 36 2 0 15 Feb 2025
Adaptive Neural Networks for Intelligent Data-Driven Development Youssef Shoeb Azarm Nowzad Hanno Gottschalk 63 2 0 14 Feb 2025
Learning Human Skill Generators at Key-Step Levels Yilu Wu Chenhui Zhu Shuai Wang Hanlin Wang Jing Wang Zhaoxiang Zhang Limin Wang VGen 112 0 0 12 Feb 2025
Matrix3D: Large Photogrammetry Model All-in-One Yuanxun Lu Jingyang Zhang Tian Fang Jean-Daniel Nahmias Yanghai Tsin Long Quan Xun Cao Yao Yao Shiwei Li 111 4 0 11 Feb 2025
From Pixels to Components: Eigenvector Masking for Visual Representation Learning Alice Bizeul Thomas M. Sutter Alain Ryser Bernhard Schölkopf Julius von Kügelgen Julia E. Vogt 86 1 0 10 Feb 2025
Multi-Scale Feature Fusion with Image-Driven Spatial Integration for Left Atrium Segmentation from Cardiac MRI Images Bipasha Kundu Zixin Yang R. Simon Cristian A. Linte 31 0 0 10 Feb 2025
Fully Exploiting Vision Foundation Model's Profound Prior Knowledge for Generalizable RGB-Depth Driving Scene Parsing Sicen Guo Tianyou Wen Chuang-Wei Liu Qijun Chen Rui Fan 55 0 0 10 Feb 2025
SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps Ola Shorinwa Jiankai Sun Mac Schwager Anirudha Majumdar 3DGS 74 3 0 10 Feb 2025
Imitation Learning from a Single Temporally Misaligned Video William Huey Huaxiaoyue Wang Anne Wu Yoav Artzi Sanjiban Choudhury AI4TS 60 0 0 08 Feb 2025
No Free Lunch in Annotation either: An objective evaluation of foundation models for streamlining annotation in animal tracking Emil Mededovic Valdy Laurentius Yuli Wu Marcin Kopaczka Zhu Chen Mareike Schulz René Tolba Johannes Stegmaier 84 1 0 06 Feb 2025
Universal Sparse Autoencoders: Interpretable Cross-Model Concept Alignment Harrish Thasarathan Julian Forsyth Thomas Fel M. Kowal Konstantinos G. Derpanis 105 7 0 06 Feb 2025
ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models Ying Zhang Maoliang Yin Wenfu Bi Haibao Yan Shaohan Bian Cui-Hua Zhang C. Hua 73 2 0 05 Feb 2025
Efficient Domain Adaptation of Multimodal Embeddings using Constrastive Learning Georgios Margaritis Periklis Petridis Dimitris Bertsimas 54 0 0 04 Feb 2025
UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation Tao Zhang Jinyong Wen Zhen Chen Kun Ding S. Xiang Chunhong Pan 72 1 0 04 Feb 2025
AquaticCLIP: A Vision-Language Foundation Model for Underwater Scene Analysis B. Alawode I. I. Ganapathi S. Javed N. Werghi Mohammed Bennamoun Arif Mahmood CLIP VLM 70 1 0 03 Feb 2025
Label Correction for Road Segmentation Using Road-side Cameras Henrik Toikka Eerik Alamikkotervo Risto Ojala 64 0 0 03 Feb 2025
Exploring Few-Shot Defect Segmentation in General Industrial Scenarios with Metric Learning and Vision Foundation Models Tongkun Liu Bing Li Xiao Jin Yupeng Shi Qiuying Li Xiang Wei 55 0 0 03 Feb 2025
Lifting by Gaussians: A Simple, Fast and Flexible Method for 3D Instance Segmentation Rohan Chacko Nicolai Haeni Eldar Khaliullin Lin Sun Douglas Lee 3DGS 42 1 0 31 Jan 2025
Mobile Manipulation Instruction Generation from Multiple Images with Automatic Metric Enhancement Kei Katsumata Motonari Kambara Daichi Yashima Ryosuke Korekata Komei Sugiura 61 0 0 28 Jan 2025
MATCHA:Towards Matching Anything Fei Xue Sven Elflein Laura Leal-Taixe Qunjie Zhou 49 0 0 28 Jan 2025
Diffusion Generative Modeling for Spatially Resolved Gene Expression Inference from Histology Images Sichen Zhu Yuchen Zhu Molei Tao Peng-Chao Qiu MedIm 31 0 0 28 Jan 2025
MADation: Face Morphing Attack Detection with Foundation Models Eduarda Caldeira Guray Ozgur Tahar Chettaoui Marija Ivanovska Peter Peer Fadi Boutros Vitomir Štruc Naser Damer CVBM 39 1 1 28 Jan 2025
Controllable Forgetting Mechanism for Few-Shot Class-Incremental Learning Kirill Paramonov Mete Ozay Eunju Yang J. Moon Umberto Michieli 56 0 0 28 Jan 2025
Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation Adil Kaan Akan Yucel Yemez DiffM OCL 42 0 0 27 Jan 2025
Rethinking Encoder-Decoder Flow Through Shared Structures Frederik Laboyrie M. K. Yucel Albert Saà-Garriga AI4CE 40 0 0 24 Jan 2025
Towards Scalable Topological Regularizers Hiu-Tung Wong Darrick Lee Hong Yan BDL 57 0 0 24 Jan 2025
DynamicEarth: How Far are We from Open-Vocabulary Change Detection? Kaiyu Li Xiangyong Cao Yupeng Deng Chao Pang Zepeng Xin Deyu Meng Zhi Wang ObjD 69 1 0 22 Jan 2025
Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks Alessio Quercia Erenus Yildiz Zhuo Cao Kai Krajsek Abigail Morrison Ira Assent Hanno Scharr 51 0 0 22 Jan 2025
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos Sili Chen Hengkai Guo Shengnan Zhu Feihu Zhang Zilong Huang Jiashi Feng Bingyi Kang VLM AuLLM MDE 61 11 0 21 Jan 2025