EmoVIT: Revolutionizing Emotion Insights with Visual Instruction Tuning

EmoVIT: Revolutionizing Emotion Insights with Visual Instruction Tuning

25 April 2024

Wen-Huang Cheng

Papers citing "EmoVIT: Revolutionizing Emotion Insights with Visual Instruction Tuning"

14 / 14 papers shown

Title
Emotion-Qwen: Training Hybrid Experts for Unified Emotion and General Vision-Language Understanding Dawei Huang Qing Li Chuan Yan Zebang Cheng Y. Huang Xiang Li B. Li X. U. Wang Z. Lian Xiaojiang Peng 24 0 0 10 May 2025
Why We Feel: Breaking Boundaries in Emotional Reasoning with Multimodal Large Language Models Yuxiang Lin Jingdong Sun Zhi-Qi Cheng Jue Wang Haomin Liang Zebang Cheng Yifei Dong Jun-Yan He Xiaojiang Peng Xian-Sheng Hua 41 0 0 10 Apr 2025
Face-LLaVA: Facial Expression and Attribute Understanding through Instruction Tuning Ashutosh Chaubey Xulang Guan Mohammad Soleymani CVBM MLLM VLM 66 0 0 09 Apr 2025
EmoAgent: Multi-Agent Collaboration of Plan, Edit, and Critic, for Affective Image Manipulation Qi Mao Haobo Hu Yujie He Difei Gao Haokun Chen Libiao Jin DiffM 45 0 0 14 Mar 2025
Omni-SILA: Towards Omni-scene Driven Visual Sentiment Identifying, Locating and Attributing in Videos Jiamin Luo Jingjing Wang Junxiao Ma Yujie Jin Shoushan Li Guodong Zhou 31 0 0 26 Feb 2025
SentiFormer: Metadata Enhanced Transformer for Image Sentiment Analysis Bin Feng Shulan Ruan Mingzheng Yang Dongxuan Han Huijie Liu Kai Zhang Qi Liu ViT 52 0 0 24 Feb 2025
TinyEmo: Scaling down Emotional Reasoning via Metric Projection Cristian Gutierrez LRM 62 0 0 17 Feb 2025
Evaluating Vision-Language Models for Emotion Recognition Sree Bhattacharyya James Z. Wang VLM 53 0 0 08 Feb 2025
StimuVAR: Spatiotemporal Stimuli-aware Video Affective Reasoning with Multimodal Large Language Models Y. Guo Faizan Siddiqui Yang Zhao Rama Chellappa Shao-Yuan Lo LRM 24 2 0 31 Aug 2024
SZTU-CMU at MER2024: Improving Emotion-LLaMA with Conv-Attention for Multimodal Emotion Recognition Zebang Cheng Shuyuan Tu Dawei Huang Minghan Li Xiaojiang Peng Zhi-Qi Cheng Alexander G. Hauptmann 43 2 0 20 Aug 2024
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning Zebang Cheng Zhi-Qi Cheng Jun-Yan He Jingdong Sun Kai Wang Yuxiang Lin Zheng Lian Xiaojiang Peng Alexander G. Hauptmann MLLM 29 28 0 17 Jun 2024
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 259 4,223 0 30 Jan 2023
LAVIS: A Library for Language-Vision Intelligence Dongxu Li Junnan Li Hung Le Guangsen Wang Silvio Savarese S. Hoi VLM 113 51 0 15 Sep 2022
PDANet: Polarity-consistent Deep Attention Network for Fine-grained Visual Emotion Regression Sicheng Zhao Zizhou Jia Hui Chen Leida Li Guiguang Ding Kurt Keutzer 25 62 0 11 Sep 2019