Separating Skills and Concepts for Novel Visual Question Answering

Separating Skills and Concepts for Novel Visual Question Answering

19 July 2021

Spencer Whitehead

Heng Ji

Papers citing "Separating Skills and Concepts for Novel Visual Question Answering"

12 / 12 papers shown

Title
Neural-Logic Human-Object Interaction Detection Liulei Li Jianan Wei Wenguan Wang Yi Yang 29 16 0 16 Nov 2023
Visual Question Answering: A Survey on Techniques and Common Trends in Recent Literature Ana Claudia Akemi Matsuki de Faria Felype de Castro Bastos Jose Victor Nogueira Alves da Silva Vitor Lopes Fabris Valeska Uchôa Décio Gonccalves de Aguiar Neto C. F. G. Santos 25 22 0 18 May 2023
ViperGPT: Visual Inference via Python Execution for Reasoning Dídac Surís Sachit Menon Carl Vondrick MLLM LRM ReLM 40 429 0 14 Mar 2023
DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning Zhuo Chen Yufen Huang Jiaoyan Chen Yuxia Geng Wen Zhang Yin Fang Jeff Z. Pan Huajun Chen VLM 24 64 0 04 Jul 2022
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering A. Piergiovanni Wei Li Weicheng Kuo M. Saffar Fred Bertsch A. Angelova 12 16 0 02 May 2022
REX: Reasoning-aware and Grounded Explanation Shi Chen Qi Zhao 20 18 0 11 Mar 2022
Webly Supervised Concept Expansion for General Purpose Vision Models Amita Kamath Christopher Clark Tanmay Gupta Eric Kolve Derek Hoiem Aniruddha Kembhavi VLM 19 54 0 04 Feb 2022
Latent Structure Mining with Contrastive Modality Fusion for Multimedia Recommendation Jinghao Zhang Yanqiao Zhu Qiang Liu Mengqi Zhang Shu Wu Liang Wang 14 34 0 01 Nov 2021
Decoupling the Role of Data, Attention, and Losses in Multimodal Transformers Lisa Anne Hendricks John F. J. Mellor R. Schneider Jean-Baptiste Alayrac Aida Nematzadeh 75 110 0 31 Jan 2021
Explainable and Explicit Visual Reasoning over Scene Graphs Jiaxin Shi Hanwang Zhang Juan-Zi Li OCL 155 230 0 05 Dec 2018
Building machines that adapt and compute like brains Brenden Lake J. Tenenbaum AI4CE FedML NAI AILaw 243 891 0 11 Nov 2017
Effective Approaches to Attention-based Neural Machine Translation Thang Luong Hieu H. Pham Christopher D. Manning 214 7,687 0 17 Aug 2015