v1v2v3 (latest)

Masked-attention Mask Transformer for Universal Image Segmentation

2 December 2021

Papers citing "Masked-attention Mask Transformer for Universal Image Segmentation"

50 / 1,661 papers shown

Title
Split Matching for Inductive Zero-shot Semantic Segmentation Jialei Chen Xu Zheng Dongyue Li Chong Yi Seigo Ito D. Paudel Luc Van Gool Hiroshi Murase Daisuke Deguchi VLM 486 2 0 08 May 2025
Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle Petr Jahoda Jan Cech 157 0 0 07 May 2025
DeCLIP: Decoupled Learning for Open-Vocabulary Dense PerceptionComputer Vision and Pattern Recognition (CVPR), 2025 Junjie Wang Bin Chen Yulin Li Bin Kang Yulin Chen Zhuotao Tian VLM 273 5 0 07 May 2025
Are Synthetic Corruptions A Reliable Proxy For Real-World Corruptions? Shashank Agnihotri David Schader Nico Sharei Mehmet Ege Kaçar Margret Keuper 340 3 0 07 May 2025
3D Can Be Explored In 2D: Pseudo-Label Generation for LiDAR Point Clouds Using Sensor-Intensity-Based 2D Semantic Segmentation Andrew Caunes Thierry Chateau Vincent Frémont 3DPC 264 3 0 06 May 2025
Panoramic Out-of-Distribution Segmentation Mengfei Duan Kailun Yang Yanmei Zhang Yihong Cao Fei Teng Kai Luo Kailai Li Zhiyong Li 398 0 0 06 May 2025
Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025 Yankai Jiang Peng Zhang Ke Wang Yuan Tian Hai Lin Xinyu Wang MedIm 928 0 0 05 May 2025
Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images Siddharth Kothari Srinivasan Murali Sankalp Kothari Ujjwal Verma Jaya Sreevalsan-Nair 397 0 0 03 May 2025
Global Collinearity-aware Polygonizer for Polygonal Building Mapping in Remote SensingIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2025 Fahong Zhang Yilei Shi Xiao Xiang Zhu 174 3 0 02 May 2025
VSC: Visual Search Compositional Text-to-Image Diffusion Model Do Huu Dat Nam Hyeonu Po Yuan Mao Tae-Hyun Oh DiffM CoGe 237 1 0 02 May 2025
Mcity Data Engine: Iterative Model Improvement Through Open-Vocabulary Data Selection Daniel Bogdoll Rajanikant Ananta Abeyankar Giridharan Isabel Moore Gregory Stevens Henry X. Liu VLM 323 0 0 30 Apr 2025
Learning Streaming Video Representation via Multitask Training Yibin Yan Jilan Xu Shangzhe Di Yikun Liu Yudi Shi Qirui Chen Zeqian Li Yifei Huang Weidi Xie CLL 432 3 0 28 Apr 2025
BARIS: Boundary-Aware Refinement with Environmental Degradation Priors for Robust Underwater Instance Segmentation Pin-Chi Pan Soo-Chang Pei 260 0 0 28 Apr 2025
Foundation Model-Driven Framework for Human-Object Interaction Prediction with Segmentation Mask Integration Juhan Park Kyungjae Lee Hyung Jin Chang Jungchan Cho VLM 218 0 0 28 Apr 2025
PhenoAssistant: A Conversational Multi-Agent AI System for Automated Plant Phenotyping Feng Chen Ilias Stogiannidis Andrew Wood Danilo Bueno Dominic Williams ... Stephen A. Rolfe Tracy Lawson Tony Pridmore M. Giuffrida Sotirios A. Tsaftaris 168 1 0 28 Apr 2025
Open-set Anomaly Segmentation in Complex Scenarios Song Xia Yi Yu Henghui Ding Wenhan Yang Shixuan Liu Alex C. Kot Xudong Jiang DiffM 227 1 0 28 Apr 2025
CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis Alexander Baumann Leonardo Ayala Siyang Song Jan Sellner Alexander Studier-Fischer Berkin Özdemir Lena Maier-Hein Slobodan Ilic 270 0 0 27 Apr 2025
What is the Added Value of UDA in the VFM Era? B. B. Englert Tommie Kerssies Gijs Dubbelman 235 1 0 25 Apr 2025
DreamO: A Unified Framework for Image Customization Chong Mou Yanze Wu Wenxu Wu Zinan Guo Pengze Zhang ... Shaojin Wu Songtao Zhao Jian Zhang Qian He Xinglong Wu 486 42 0 23 Apr 2025
Beyond Anonymization: Object Scrubbing for Privacy-Preserving 2D and 3D Vision Tasks Murat Bilgehan Ertan Ronak Sahu Phuong Ha Nguyen Kaleel Mahmood Marten van Dijk 334 0 0 23 Apr 2025
EmoSEM: Segment and Explain Emotion Stimuli in Visual Art Jing Zhang Dan Guo Zhangbin Li Meng Wang 226 0 0 20 Apr 2025
LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models Haiwen Huang Anpei Chen Volodymyr Havrylov Andreas Geiger Dan Zhang 181 9 0 18 Apr 2025
Occlusion-Ordered Semantic Instance Segmentation Soroosh Baselizadeh Cheuk-To Yu O. Veksler Yuri Boykov ISeg 3DV 245 0 0 18 Apr 2025
Fighting Fires from Space: Leveraging Vision Transformers for Enhanced Wildfire Detection and Characterization Aman Agarwal James Gearon Raksha Rank Etienne Chenevert 140 0 0 18 Apr 2025
Multiscale Tensor Summation Factorization as a New Neural Network Layer (MTS Layer) for Multidimensional Data Processing Mehmet Yamaç Muhammad Numan Yousaf S. Kiranyaz Moncef Gabbouj 190 1 0 17 Apr 2025
A Complex-valued SAR Foundation Model Based on Physically Inspired Representation Learning Hang Wu Hanbo Bi Yingchao Feng Linlin Xin Shuo Gong Tianqi Wang Zhiyuan Yan Peijin Wang Wenhui Diao Xian Sun 165 1 0 16 Apr 2025
Towards Learning to Complete Anything in Lidar Ayca Takmaz Cristiano Saltori Neehar Peri Tim Meinhardt Riccardo de Lutio Laura Leal-Taixé Aljosa Osep 3DV VLM 318 5 0 16 Apr 2025
EgoExo-Gen: Ego-centric Video Prediction by Watching Exo-centric VideosInternational Conference on Learning Representations (ICLR), 2025 Jinfeng Xu Yuanmin Huang Baoqi Pei Junlin Hou Qingqiu Li Guo Chen Yuhui Zhang Rui Feng Weidi Xie DiffM 245 16 0 16 Apr 2025
A comprehensive review of remote sensing in wetland classification and mapping Shuai Yuan Xiangan Liang Tianwu Lin Shuang Chen Rui Liu Jie Wang Huatian Zhang Peng Gong 256 3 0 15 Apr 2025
Pixel-SAIL: Single Transformer For Pixel-Grounded Understanding Tao Zhang Xuelong Li Zilong Huang Yuchen Ren Weixian Lei XueQing Deng Shihao Chen Shilin Xu Jiashi Feng MLLM LRM 295 17 0 14 Apr 2025
FLOSS: Free Lunch in Open-vocabulary Semantic Segmentation Yasser Benigmim Mohammad Fahes Tuan-Hung Vu Andrei Bursuc Raoul de Charette VLM 412 1 0 14 Apr 2025
SegEarth-R1: Geospatial Pixel Reasoning via Large Language Model Kaiyu Li Zepeng Xin Li Pang Chao Pang Yupeng Deng Jing Yao Guisong Xia Deyu Meng Zhi Wang Xiangyong Cao VLM LRM 256 22 0 13 Apr 2025
TextSplat: Text-Guided Semantic Fusion for Generalizable Gaussian Splatting Zhicong Wu Hongbin Xu Gang Xu Ping Nie Zhixin Yan Jinkai Zheng Liangqiong Qu Ming Li Liqiang Nie 3DGS 262 4 0 13 Apr 2025
Uncertainty Guided Refinement for Fine-Grained Salient Object DetectionIEEE Transactions on Image Processing (IEEE TIP), 2025 Yao Yuan Pan Gao Qun Dai Jie Qin Wei Xiang 352 5 0 13 Apr 2025
FMLGS: Fast Multilevel Language Embedded Gaussians for Part-level Interactive Agents Xin Tan Yuzhou Ji He Zhu Yuan Xie 3DGS 172 2 0 11 Apr 2025
Hypergraph Vision Transformers: Images are More than Nodes, More than EdgesComputer Vision and Pattern Recognition (CVPR), 2025 Joshua Fixelle ViT 203 8 0 11 Apr 2025
Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions Tommaso Galliena Tommaso Apicella Stefano Rosa Pietro Morerio Alessio Del Bue Lorenzo Natale 309 0 0 11 Apr 2025
ChildlikeSHAPES: Semantic Hierarchical Region Parsing for Animating Figure Drawings Astitva Srivastava Harrison Jesse Smith Thu Nguyen-Phuoc Yuting Ye 266 0 0 10 Apr 2025
DGOcc: Depth-aware Global Query-based Network for Monocular 3D Occupancy Prediction Xu Zhao Pengju Zhang Bo Liu Yihong Wu 228 2 0 10 Apr 2025
Domain Generalization through Attenuation of Domain-Specific Information Reiji Saito Kazuhiro Hotta 140 0 0 09 Apr 2025
GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered ScenesIEEE Robotics and Automation Letters (IEEE RA-L), 2025 S. Back J. Lee Kangmin Kim Heeseon Rho Geonhyup Lee ... S. Lee Sangjun Noh Youngjin Lee Taeyeop Lee K. Lee 3DV 285 1 0 09 Apr 2025
Zeus: Zero-shot LLM Instruction for Union Segmentation in Multimodal Medical ImagingInternational Journal of Machine Learning and Cybernetics (IJMLC), 2025 Siyuan Dai Kai Ye Guodong Liu Haoteng Tang Chen Tang MedIm 175 4 0 09 Apr 2025
HER-Seg: Holistically Efficient Segmentation for High-Resolution Medical Images Qing Xu Zhenye Lou Chenxin Li Xiangjian He Rong Qu Tesema Fiseha Berhanu Yi Wang Wenting Duan Daming Gao MedIm 193 0 0 08 Apr 2025
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation Xiaoxing Hu Ziyang Gong Longji Xu Yuru Jia Fei Lin ... Jianhong Han Zhuoran Sun Gen Luo Gen Luo Xue Yang 1.0K 3 0 08 Apr 2025
Falcon: Fractional Alternating Cut with Overcoming Minima in Unsupervised Segmentation Xiao Zhang Xiangyu Han Xiwen Lai Yao Sun Pei Zhang Konrad Kording 233 0 0 08 Apr 2025
TMT: Cross-domain Semantic Segmentation with Region-adaptive Transferability Estimation Enming Zhang Tianying Wang Yanru Wu Jun Wang Yang Tan Ruizhe Zhao Guan Wang Yang Li ViT 364 0 0 08 Apr 2025
S^4M: Boosting Semi-Supervised Instance Segmentation with SAM Heeji Yoon Heeseong Shin Eunbeen Hong Hyunwook Choi Hansang Cho Daun Jeong Seungryong Kim 201 1 0 07 Apr 2025
Prior2Former -- Evidential Modeling of Mask Transformers for Assumption-Free Open-World Panoptic Segmentation Sebastian Schmidt Julius Körner Dominik Fuchsgruber Stefano Gasperini F. Tombari Stephan Günnemann 319 2 0 07 Apr 2025
Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images Wenzhao Tang Weihang Li Xiucheng Liang Olaf Wysocki Filip Biljecki Christoph Holst Boris Jutzi 169 4 0 07 Apr 2025
BoxSeg: Quality-Aware and Peer-Assisted Learning for Box-supervised Instance Segmentation Jinxiang Lai Wenlong Wu Jiawei Zhan Jian Li Bin-Bin Gao Jing Liu Jie Zhang Song Guo ISeg 205 0 0 07 Apr 2025

All Papers

Masked-attention Mask Transformer for Universal Image Segmentation

Papers citing "Masked-attention Mask Transformer for Universal Image Segmentation"