Joint learning of object graph and relation graph for visual question
answering

Joint learning of object graph and relation graph for visual question answering

IEEE International Conference on Multimedia and Expo (ICME), 2022

9 May 2022

Hao Li

ArXiv (abs)PDF HTML

Papers citing "Joint learning of object graph and relation graph for visual question answering"

5 / 5 papers shown

Title
DiffusionRet: Generative Text-Video Retrieval with Diffusion ModelIEEE International Conference on Computer Vision (ICCV), 2023 Peng Jin Hao Li Ze-Long Cheng Kehan Li Xiang Ji Chang-rui Liu Li-ming Yuan Jie Chen DiffM VGen 281 80 0 17 Mar 2023
FTM: A Frame-level Timeline Modeling Method for Temporal Graph Representation LearningAAAI Conference on Artificial Intelligence (AAAI), 2023 Bowen Cao Qichen Ye Weiyuan Xu Yuexian Zou 219 1 0 23 Feb 2023
Expectation-Maximization Contrastive Learning for Compact Video-and-Language RepresentationsNeural Information Processing Systems (NeurIPS), 2022 Peng Jin Jinfa Huang Fenglin Liu Xian Wu Shen Ge Guoli Song David Clifton Jing Chen VLM 256 83 0 21 Nov 2022
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question AnsweringIEEE Transactions on Image Processing (IEEE TIP), 2022 Hao Li Jinfa Huang Peng Jin Guoli Song Qi Wu Jie Chen 329 27 0 21 Sep 2022
Locality Guidance for Improving Vision Transformers on Tiny DatasetsEuropean Conference on Computer Vision (ECCV), 2022 Kehan Li Runyi Yu Zhennan Wang Li-ming Yuan Guoli Song Jie Chen ViT 137 52 0 20 Jul 2022