Encoder Fusion Network with Co-Attention Embedding for Referring Image Segmentation

Computer Vision and Pattern Recognition (CVPR), 2021

5 May 2021

Huchuan Lu

Papers citing "Encoder Fusion Network with Co-Attention Embedding for Referring Image Segmentation"

50 / 106 papers shown

Layover or Direct Flight: Rethinking Audio-Guided Image Segmentation

Joel Alberto Santos

Zongwei Wu

Xavier Alameda-Pineda

Radu Timofte

128

27 Nov 2025

RefAM: Attention Magnets for Zero-Shot Referral Segmentation

Anna Kukleva

Enis Simsar

A. Tonioni

Muhammad Ferjad Naeem

709

26 Sep 2025

Improving Generalized Visual Grounding with Instance-aware Joint LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

355

17 Sep 2025

TFANet: Three-Stage Image-Text Feature Alignment Network for Robust Referring Image Segmentation

226

16 Sep 2025

Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder

213

06 Aug 2025

Referring Remote Sensing Image Segmentation with Cross-view Semantics Interaction Network

Jiaxing Yang

Lihe Zhang

Huchuan Lu

249

02 Aug 2025

Multimodal Referring Segmentation: A Survey

521

01 Aug 2025

Multi-encoder nnU-Net outperforms transformer models with self-supervised pretraining

Seyedeh Sahar Taheri Otaghsara

Reza Rahmanzadeh

ViT

335

01 Jul 2025

ReSeDis: A Dataset for Referring-based Object Search across Large-Scale Image Collections

222

18 Jun 2025

Progressive Language-guided Visual Learning for Multi-Task Visual Grounding

440

22 Apr 2025

LGD: Leveraging Generative Descriptions for Zero-Shot Referring Image SegmentationPattern Recognition (Pattern Recogn.), 2025

520

20 Apr 2025

Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual PerceptionInternational Conference on Learning Representations (ICLR), 2025

578

15 Apr 2025

Pixel-SAIL: Single Transformer For Pixel-Grounded Understanding

419

14 Apr 2025

Towards Unified Referring Expression Segmentation Across Omni-Level Visual Target Granularities

346

02 Apr 2025

BiPVL-Seg: Bidirectional Progressive Vision-Language Fusion with Global-Local Alignment for Medical Image Segmentation

290

30 Mar 2025

Referring Human Pose and Mask Estimation in the WildNeural Information Processing Systems (NeurIPS), 2024

298

27 Oct 2024

LESS: Label-Efficient and Single-Stage Referring 3D SegmentationNeural Information Processing Systems (NeurIPS), 2024

479

17 Oct 2024

Segment as You Wish -- Free-Form Language-Based Segmentation for Medical Images

386

02 Oct 2024

Fully Aligned Network for Referring Image SegmentationVisual Communications and Image Processing (VCIP), 2024

Yong-Jin Liu

Ruihao Xu

Yansong Tang

329

29 Sep 2024

HiFi-CS: Towards Open Vocabulary Visual Grounding For Robotic Grasping Using Vision-Language Models

V. Bhat

Prashanth Krishnamurthy

Ramesh Karri

Farshad Khorrami

553

16 Sep 2024

Dynamic Prompting of Frozen Text-to-Image Diffusion Models for Panoptic Narrative GroundingACM Multimedia (MM), 2024

Hongyu Li

Bin Ma

Jizhong Han

Si Liu

DiffM

274

12 Sep 2024

Language-guided Scale-aware MedSegmentor for Lesion Segmentation in Medical Imaging

451

30 Aug 2024

Cross-aware Early Fusion with Stage-divided Vision and Language Transformer Encoders for Referring Image SegmentationIEEE transactions on multimedia (IEEE TMM), 2024

Yubin Cho

Hyunwoo Yu

Suk-Ju Kang

332

14 Aug 2024

An Efficient and Effective Transformer Decoder-Based Framework for Multi-Task Visual GroundingEuropean Conference on Computer Vision (ECCV), 2024

Wei Chen

Mahdieh Hatamian

Yu Wu

276

02 Aug 2024

Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation

Seonghoon Yu

Paul Hongsuck Seo

Jeany Son

DiffM

479

10 Jul 2024

SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation

Sayan Nag

Koustava Goswami

Srikrishna Karanam

337

02 Jul 2024

OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding

Tao Zhang

Xiangtai Li

Hao Fei

Chen Change Loy

412

149

27 Jun 2024

SRC-Net: Bi-Temporal Spatial Relationship Concerned Network for Change DetectionIEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (IEEE JSTARS), 2024

Hongjia Chen

Xin Xu

Fangling Pu

395

09 Jun 2024

HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation

409

24 May 2024

Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation

Jing Liu

307

18 May 2024

Spatial Semantic Recurrent Mining for Referring Image Segmentation

Jiaxing Yang

Lihe Zhang

Jiayu Sun

Huchuan Lu

341

15 May 2024

Curriculum Point Prompting for Weakly-Supervised Referring Image Segmentation

Qiyuan Dai

Sibei Yang

241

18 Apr 2024

Decoupling Static and Hierarchical Motion Perception for Referring Video SegmentationComputer Vision and Pattern Recognition (CVPR), 2024

Shuting He

Henghui Ding

VOS

324

04 Apr 2024

Deep Instruction Tuning for Segment Anything Model

Chaoyang Zhu

380

31 Mar 2024

ReMamber: Referring Image Segmentation with Mamba Twister

Jiangchao Yao

374

26 Mar 2024

Empowering Segmentation Ability to Multi-modal Large Language Models

322

21 Mar 2024

Rethinking Referring Object Removal

245

14 Mar 2024

RESMatch: Referring Expression Segmentation in a Semi-Supervised Manner

Didi Zhu

336

08 Feb 2024

Collaborative Position Reasoning Network for Referring Image Segmentation

Jingdong Wang

361

22 Jan 2024

UniRef++: Segment Every Reference Object in Spatial and Temporal Spaces

Huchuan Lu

Ping Luo

327

25 Dec 2023

SurgicalPart-SAM: Part-to-Whole Collaborative Prompting for Surgical Instrument Segmentation

Kun Hu

Zhiyong Wang

260

22 Dec 2023

Mask Grounding for Referring Image Segmentation

Gao Huang

471

19 Dec 2023

Context Disentangling and Prototype Inheriting for Robust Visual Grounding

Wei Tang

307

19 Dec 2023

GSVA: Generalized Segmentation via Multimodal Large Language ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Gao Huang

695

155

15 Dec 2023

EVP: Enhanced Visual Perception using Inverse Multi-Attentive Feature Refinement and Regularized Image-Text Alignment

288

13 Dec 2023

Unveiling Parts Beyond Objects:Towards Finer-Granularity Referring Expression SegmentationComputer Vision and Pattern Recognition (CVPR), 2023

Yisi Zhang

Jing Liu

357

13 Dec 2023

Universal Segmentation at Arbitrary Granularity with Language InstructionComputer Vision and Pattern Recognition (CVPR), 2023

Yong Liu

Yujiu Yang

378

04 Dec 2023

Towards Generalizable Referring Image Segmentation via Target Prompt and Visual CoherenceInternational Conference on Information Photonics (ICIP), 2023

Qingjie Liu

Yunhong Wang

244

01 Dec 2023

Language-guided Robot Grasping: CLIP-based Referring Grasp Synthesis in ClutterConference on Robot Learning (CoRL), 2023

305

09 Nov 2023

Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic Narrative GroundingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Junshi Huang

353

02 Nov 2023