ESResNet: Environmental Sound Classification Based on Visual Domain Models

International Conference on Pattern Recognition (ICPR), 2020

15 April 2020

Papers citing "ESResNet: Environmental Sound Classification Based on Visual Domain Models"

38 / 38 papers shown

Spike Encoding for Environmental Sound: A Comparative Benchmark

Andres Larroza

Javier Naranjo-Alcazar

Vicent Ortiz Castelló

M. Cobos

P. Zuccarello

437

14 Mar 2025

Transfer Learning in Vocal Education: Technical Evaluation of Limited Samples Describing Mezzo-soprano

...

199

30 Oct 2024

OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities

Hanane Azzag

M. Lebbah

ObjD

380

17 Sep 2024

Sound Tagging in Infant-centric Home Soundscapes

Mohammad Nur Hossain Khan

205

25 Jun 2024

Emotional Speech-driven 3D Body Animation via Disentangled Latent Diffusion

552

07 Dec 2023

Spectro-ViT: A Vision Transformer Model for GABA-edited MRS Reconstruction Using Spectrograms

Roberto Souza

196

26 Nov 2023

Formal Verification of Long Short-Term Memory based Audio Classifiers: A Star based Approach

Neelanjana Pal

Taylor T. Johnson

182

16 Nov 2023

AudRandAug: Random Image Augmentations for Audio Classification

235

09 Sep 2023

Bridging High-Quality Audio and Video via Language for Sound Effects Retrieval from Visual QueriesIEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2023

158

17 Aug 2023

Accommodating Audio Modality in CLIP for Multimodal ProcessingAAAI Conference on Artificial Intelligence (AAAI), 2023

Qin Jin

212

12 Mar 2023

Audiovisual Masked AutoencodersIEEE International Conference on Computer Vision (ICCV), 2022

Mariana-Iuliana Georgescu

368

09 Dec 2022

Effective Audio Classification Network Based on Paired Inverse Pyramid Structure and Dense MLP BlockInternational Conference on Intelligent Computing (ICIC), 2022

417

05 Nov 2022

Language-based Audio Retrieval Task in DCASE 2022 ChallengeWorkshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2022

Huang Xie

Samuel Lipping

Maria Sandsten

240

20 Sep 2022

SampleMatch: Drum Sample Retrieval by Musical ContextInternational Society for Music Information Retrieval Conference (ISMIR), 2022

Stefan Lattner

186

01 Aug 2022

GAFX: A General Audio Feature eXtractor

Zhaoyang Bu

Han Zhang

Xiaohu Zhu

157

19 Jul 2022

Feature Pyramid Attention based Residual Neural Network for Environmental Sound Classification

247

28 May 2022

Combination of Time-domain, Frequency-domain, and Cepstral-domain Acoustic Features for Speech Commands Classification

Yikang Wang

Hiromitsu Nishizaki

288

30 Mar 2022

Interactive Audio-text Representation for Automated Audio Captioning with Contrastive Learning

Chen Chen

Yuchen Hu

227

29 Mar 2022

CMKD: CNN/Transformer-Based Cross-Model Knowledge Distillation for Audio Classification

223

13 Mar 2022

Maximizing Audio Event Detection Model Performance on Small Datasets Through Knowledge Transfer, Data Augmentation, And Pretraining: An Ablation StudyIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Daniel C. Tompkins

Kshitiz Kumar

Jian Wu

290

07 Feb 2022

Connecting the Dots between Audio and Text without Parallel Data through Visual Knowledge Transfer

Yejin Choi

396

16 Dec 2021

NeuroView: Explainable Deep Network Decision Making

C. Barberan

Randall Balestriero

Richard G. Baraniuk

FAtt

158

15 Oct 2021

Cross-domain Semi-Supervised Audio Event Classification Using Contrastive Regularization

Donmoon Lee

Kyogu Lee

218

29 Sep 2021

AudioCLIP: Extending CLIP to Image, Text and Audio

664

515

24 Jun 2021

ERANNs: Efficient Residual Audio Neural Networks for Audio Pattern RecognitionPattern Recognition Letters (PR), 2021

S. Verbitskiy

Vladimir Berikov

Viacheslav Vyshegorodtsev

365

03 Jun 2021

Unsupervised Discriminative Learning of Sounds for Audio Event ClassificationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Sascha Hornauer

Ke Li

Stella X. Yu

Shabnam Ghaffarzadegan

Liu Ren

SSL

163

19 May 2021

ESResNe(X)t-fbsp: Learning Robust Time-Frequency Transformation of AudioIEEE International Joint Conference on Neural Network (IJCNN), 2021

219

23 Apr 2021

Detection of Audio-Video Synchronization Errors Via Event DetectionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Joshua Peter Ebenezer

209

20 Apr 2021

AST: Audio Spectrogram TransformerInterspeech (Interspeech), 2021

742

1,245

05 Apr 2021

Environmental Sound Classification on the Edge: A Pipeline for Deep Acoustic Networks on Extremely Resource-Constrained DevicesPattern Recognition (Pattern Recogn.), 2021

429

05 Mar 2021

Multi-view Audio and Music ClassificationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

169

03 Mar 2021

SoundCLR: Contrastive Learning of Representations For Improved Environmental Sound Classification

Alireza Nasiri

Jianjun Hu

149

02 Mar 2021

Comparison of semi-supervised deep learning algorithms for audio classificationEURASIP Journal on Audio, Speech, and Music Processing (EURASIP J. Audio Speech Music Process), 2021

Léo Cances

Etienne Labbé

Thomas Pellegrini

198

16 Feb 2021

PSLA: Improving Audio Tagging with Pretraining, Sampling, Labeling, and AggregationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2021

454

176

02 Feb 2021

Urban Sound Classification : striving towards a fair comparison

Augustin Arnault

Baptiste Hanssens

Nicolas Riche

158

22 Oct 2020

CLAR: Contrastive Learning of Auditory RepresentationsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

Haider Al-Tahan

Y. Mohsenzadeh

SSL

449

19 Oct 2020

Rethinking CNN Models for Audio Classification

Kamalesh Palanisamy

Dipika Singhania

Angela Yao

SSL

248

170

22 Jul 2020

A Sequential Self Teaching Approach for Improving Generalization in Sound Event Recognition

Anurag Kumar

V. Ithapu

272

30 Jun 2020