Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2312.13567
Cited By

Fine-grained Disentangled Representation Learning for Multimodal Emotion
Recognition

Fine-grained Disentangled Representation Learning for Multimodal Emotion Recognition

21 December 2023

Yong Qin

ArXiv (abs)PDF HTML

Papers citing "Fine-grained Disentangled Representation Learning for Multimodal Emotion Recognition"

9 / 9 papers shown

Decoupled Audio-Visual Dataset Distillation

Decoupled Audio-Visual Dataset Distillation

134

2

0

22 Nov 2025

GIA-MIC: Multimodal Emotion Recognition with Gated Interactive Attention and Modality-Invariant Learning Constraints

GIA-MIC: Multimodal Emotion Recognition with Gated Interactive Attention and Modality-Invariant Learning Constraints

114

2

0

01 Jun 2025

RA-CLAP: Relation-Augmented Emotional Speaking Style Contrastive Language-Audio Pretraining For Speech Retrieval

RA-CLAP: Relation-Augmented Emotional Speaking Style Contrastive Language-Audio Pretraining For Speech Retrieval

...

232

4

0

26 May 2025

Enhancing Multimodal Emotion Recognition through Multi-Granularity Cross-Modal Alignment

Enhancing Multimodal Emotion Recognition through Multi-Granularity Cross-Modal AlignmentIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

220

10

0

31 Dec 2024

Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware Decoding

Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware DecodingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

609

5

0

21 Dec 2024

Serialized Speech Information Guidance with Overlapped Encoding
Separation for Multi-Speaker Automatic Speech Recognition

Serialized Speech Information Guidance with Overlapped Encoding Separation for Multi-Speaker Automatic Speech RecognitionSpoken Language Technology Workshop (SLT), 2024

Tatsuya Kawahara

433

5

0

01 Sep 2024

Developing vocal system impaired patient-aimed voice quality assessment
approach using ASR representation-included multiple features

Developing vocal system impaired patient-aimed voice quality assessment approach using ASR representation-included multiple featuresInterspeech (Interspeech), 2024

Tetsuya Matsumoto

Yasuhiro Tanaka

Satoshi Maesawa

158

1

0

22 Aug 2024

Iterative Prototype Refinement for Ambiguous Speech Emotion Recognition

Iterative Prototype Refinement for Ambiguous Speech Emotion RecognitionInterspeech (Interspeech), 2024

Jiaming Zhou

Yong Qin

265

9

0

01 Aug 2024

A Comprehensive Study on the Effectiveness of ASR Representations for Noise-Robust Speech Emotion Recognition

A Comprehensive Study on the Effectiveness of ASR Representations for Noise-Robust Speech Emotion Recognition

387

5

0

13 Nov 2023