v1v2v3 (latest)

AVGZSLNet: Audio-Visual Generalized Zero-Shot Learning by Reconstructing Label Features from Multi-Modal Embeddings

IEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2020

27 May 2020

Papers citing "AVGZSLNet: Audio-Visual Generalized Zero-Shot Learning by Reconstructing Label Features from Multi-Modal Embeddings"

23 / 23 papers shown

MPJudge: Towards Perceptual Assessment of Music-Induced Paintings

10 Nov 2025

REIS: A High-Performance and Energy-Efficient Retrieval System with In-Storage ProcessingInternational Symposium on Computer Architecture (ISCA), 2025

Kangqi Chen

Andreas Kosmas Kakolyris

323

19 Jun 2025

Optimizing Genetic Algorithms with Multilayer Perceptron Networks for Enhancing TinyFace Recognition

Mohammad Subhi Al-Batah

Mowafaq Salem Alzboon

Muhyeeddin Alqaraleh

CVBM

215

11 Jun 2025

Multi-Timescale Motion-Decoupled Spiking Transformer for Audio-Visual Zero-Shot Learning

217

26 May 2025

Extremely Simple Out-of-distribution Detection for Audio-visual Generalized Zero-shot Learning

304

28 Mar 2025

Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic ThresholdsComputer Vision and Pattern Recognition (CVPR), 2025

363

17 Mar 2025

Discrepancy-Aware Attention Network for Enhanced Audio-Visual Zero-Shot Learning

282

16 Dec 2024

Towards Open-Vocabulary Audio-Visual Event LocalizationComputer Vision and Pattern Recognition (CVPR), 2024

552

18 Nov 2024

Audio-visual Generalized Zero-shot Learning the Easy Way

Shentong Mo

Pedro Morgado

263

18 Jul 2024

Spiking Tucker Fusion Transformer for Audio-Visual Zero-Shot Learning

Wenrui Li

Penghong Wang

Ruiqin Xiong

Xiaopeng Fan

277

11 Jul 2024

Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models

A. Sophia Koepke

214

09 Apr 2024

Boosting Audio-visual Zero-shot Learning with Large Language Models

268

21 Nov 2023

Hyperbolic Audio-visual Zero-shot LearningIEEE International Conference on Computer Vision (ICCV), 2023

Mehrtash Harandi

252

24 Aug 2023

Audio-Visual Class-Incremental LearningIEEE International Conference on Computer Vision (ICCV), 2023

Shentong Mo

240

21 Aug 2023

Robust Sound-Guided Image ManipulationNeural Networks (NN), 2022

344

30 Aug 2022

Temporal and cross-modal attention for audio-visual zero-shot learningEuropean Conference on Computer Vision (ECCV), 2022

Otniel-Bogdan Mercea

Thomas Hummel

A. Sophia Koepke

Zeynep Akata

208

20 Jul 2022

Multimodal Open-Vocabulary Video Classification via Pre-Trained Vision and Language Models

189

15 Jul 2022

Audio-visual Generalised Zero-shot Learning with Cross-modal Attention and LanguageComputer Vision and Pattern Recognition (CVPR), 2022

Otniel-Bogdan Mercea

Lukas Riesch

A. Sophia Koepke

Zeynep Akata

193

07 Mar 2022

Sound-Guided Semantic Image Manipulation

340

30 Nov 2021

Beyond Mono to Binaural: Generating Binaural Audio from Mono Audio with Depth and Cross Modal AttentionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2021

204

15 Nov 2021

Discriminative Semantic Transitive Consistency for Cross-Modal LearningComputer Vision and Image Understanding (CVIU), 2021

Kranti K. Parida

Gaurav Sharma

212

25 Mar 2021

Beyond Image to Depth: Improving Depth Prediction using EchoesComputer Vision and Pattern Recognition (CVPR), 2021

311

15 Mar 2021

A Review of Generalized Zero-Shot Learning MethodsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

649

513

17 Nov 2020