Distilling Audio-Visual Knowledge by Compositional Contrastive Learning

Distilling Audio-Visual Knowledge by Compositional Contrastive Learning

22 April 2021

A. Sophia Koepke

Ying Shan

Papers citing "Distilling Audio-Visual Knowledge by Compositional Contrastive Learning"

8 / 8 papers shown

Title
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment Edson Araujo Andrew Rouditchenko Yuan Gong Saurabhchand Bhati Samuel Thomas Brian Kingsbury Leonid Karlinsky Rogerio Feris James Glass 27 0 0 02 May 2025
Siamese Vision Transformers are Scalable Audio-visual Learners Yan-Bo Lin Gedas Bertasius 27 5 0 28 Mar 2024
Heterogeneous Graph Learning for Acoustic Event Classification A. Shirian Mona Ahmadian Krishna Somandepalli T. Guha 25 2 0 05 Mar 2023
Bridging the Emotional Semantic Gap via Multimodal Relevance Estimation Chuan Zhang Daoxin Zhang Ruixiu Zhang Jiawei Li Jianke Zhu 25 1 0 03 Feb 2023
Semi-Supervised and Unsupervised Deep Visual Learning: A Survey Yanbei Chen Massimiliano Mancini Xiatian Zhu Zeynep Akata 24 112 0 24 Aug 2022
Sound-Guided Semantic Image Manipulation Seung Hyun Lee Wonseok Roh Wonmin Byeon Sang Ho Yoon Chanyoung Kim Jinkyu Kim Sangpil Kim DiffM 10 43 0 30 Nov 2021
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 398 532 0 21 Jul 2020
Improved Baselines with Momentum Contrastive Learning Xinlei Chen Haoqi Fan Ross B. Girshick Kaiming He SSL 235 3,029 0 09 Mar 2020