Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding

4 October 2018

Kexin Yi

Jiajun Wu

Chuang Gan

Antonio Torralba

Papers citing "Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding"

50 / 76 papers shown

Title
Modular Machine Learning: An Indispensable Path towards New-Generation Large Language Models X. Wang Haoyang Li Zeyang Zhang H. Chen Wenwu Zhu LRM 77 0 0 28 Apr 2025
We'll Fix it in Post: Improving Text-to-Video Generation with Neuro-Symbolic Feedback Minkyu Choi Sundar Sripada V. S. Harsh Goel Sahil Shah Sandeep P. Chinchali DiffM VGen 86 0 0 24 Apr 2025
Predicate Hierarchies Improve Few-Shot State Classification Emily Jin Joy Hsu Jiajun Wu OffRL 72 0 0 18 Feb 2025
Visual Graph Question Answering with ASP and LLMs for Language Parsing Jakob Johannes Bauer Thomas Eiter Nelson Higuera Ruiz J. Oetsch GNN 59 0 0 13 Feb 2025
Learning to Reason Iteratively and Parallelly for Complex Visual Reasoning Scenarios Shantanu Jaiswal Debaditya Roy Basura Fernando Cheston Tan ReLM LRM 71 2 0 20 Nov 2024
Breaking Neural Network Scaling Laws with Modularity Akhilan Boopathy Sunshine Jiang William Yue Jaedong Hwang Abhiram Iyer Ila Fiete OOD 34 2 0 09 Sep 2024
FlowLearn: Evaluating Large Vision-Language Models on Flowchart Understanding Huitong Pan Qi Zhang Cornelia Caragea Eduard Constantin Dragut Longin Jan Latecki 33 4 0 06 Jul 2024
STAR: A Benchmark for Situated Reasoning in Real-World Videos Bo Wu Shoubin Yu Zhenfang Chen Joshua B Tenenbaum Chuang Gan 33 176 0 15 May 2024
Closed Loop Interactive Embodied Reasoning for Robot Manipulation Michal Nazarczuk Jan Kristof Behrens Karla Stepanova Matej Hoffmann K. Mikolajczyk LM&Ro LRM 36 1 0 23 Apr 2024
Pre-trained Vision-Language Models Learn Discoverable Visual Concepts Yuan Zang Tian Yun Hao Tan Trung Bui Chen Sun VLM CoGe 50 9 0 19 Apr 2024
Enhancing Visual Question Answering through Question-Driven Image Captions as Prompts Övgü Özdemir Erdem Akagündüz 36 10 0 12 Apr 2024
ContPhy: Continuum Physical Concept Learning and Reasoning from Videos Zhicheng Zheng Xin Yan Zhenfang Chen Jingzhou Wang Qin Zhi Eddie Lim Joshua B. Tenenbaum Chuang Gan LRM 32 6 0 09 Feb 2024
Image Translation as Diffusion Visual Programmers Cheng Han James Liang Qifan Wang Majid Rabbani S. Dianat Raghuveer M. Rao Ying Nian Wu Dongfang Liu 29 8 0 18 Jan 2024
Neural-Logic Human-Object Interaction Detection Liulei Li Jianan Wei Wenguan Wang Yi Yang 29 16 0 16 Nov 2023
3D-Aware Visual Question Answering about Parts, Poses and Occlusions Xingrui Wang Wufei Ma Zhuowan Li Adam Kortylewski Alan L. Yuille CoGe 19 12 0 27 Oct 2023
Does Visual Pretraining Help End-to-End Reasoning? Chen Sun Calvin Luo Xingyi Zhou Anurag Arnab Cordelia Schmid OCL LRM ViT 28 3 0 17 Jul 2023
Learning Differentiable Logic Programs for Abstract Visual Reasoning Hikaru Shindo Viktor Pfanschilling D. Dhami Kristian Kersting NAI 19 6 0 03 Jul 2023
Scalable Neural-Probabilistic Answer Set Programming Arseny Skryagin Daniel Ochs D. Dhami Kristian Kersting 30 5 0 14 Jun 2023
Scallop: A Language for Neurosymbolic Programming Ziyang Li Jiani Huang Mayur Naik ReLM LRM NAI 16 30 0 10 Apr 2023
ViperGPT: Visual Inference via Python Execution for Reasoning Dídac Surís Sachit Menon Carl Vondrick MLLM LRM ReLM 45 429 0 14 Mar 2023
Dissociating language and thought in large language models Kyle Mahowald Anna A. Ivanova I. Blank Nancy Kanwisher J. Tenenbaum Evelina Fedorenko ELM ReLM 23 208 0 16 Jan 2023
See, Think, Confirm: Interactive Prompting Between Vision and Language Models for Knowledge-based Visual Reasoning Zhenfang Chen Qinhong Zhou Yikang Shen Yining Hong Hao Zhang Chuang Gan LRM VLM 29 35 0 12 Jan 2023
Super-CLEVR: A Virtual Benchmark to Diagnose Domain Robustness in Visual Reasoning Zhuowan Li Xingrui Wang Elias Stengel-Eskin Adam Kortylewski Wufei Ma Benjamin Van Durme Max Planck Institute for Informatics OOD LRM 19 56 0 01 Dec 2022
Versatile Diffusion: Text, Images and Variations All in One Diffusion Model Xingqian Xu Zhangyang Wang Eric Zhang Kai Wang Humphrey Shi DiffM 28 181 0 15 Nov 2022
Generalization Differences between End-to-End and Neuro-Symbolic Vision-Language Reasoning Systems Wang Zhu Jesse Thomason Robin Jia VLM OOD NAI LRM 21 6 0 26 Oct 2022
RulE: Knowledge Graph Reasoning with Rule Embedding Xiaojuan Tang Song-Chun Zhu Yitao Liang Muhan Zhang 13 2 0 24 Oct 2022
Mind's Eye: Grounded Language Model Reasoning through Simulation Ruibo Liu Jason W. Wei S. Gu Te-Yen Wu Soroush Vosoughi Claire Cui Denny Zhou Andrew M. Dai ReLM LRM 111 79 0 11 Oct 2022
TCNL: Transparent and Controllable Network Learning Via Embedding Human-Guided Concepts Zhihao Wang Chuang Zhu 22 1 0 07 Oct 2022
Learning to Collocate Visual-Linguistic Neural Modules for Image Captioning Xu Yang Hanwang Zhang Chongyang Gao Jianfei Cai MLLM 25 10 0 04 Oct 2022
On Grounded Planning for Embodied Tasks with Language Models Bill Yuchen Lin Chengsong Huang Qian Liu Wenda Gu Sam Sommerer Xiang Ren LM&Ro 28 39 0 29 Aug 2022
Diagnose Like a Radiologist: Hybrid Neuro-Probabilistic Reasoning for Attribute-Based Medical Image Diagnosis Gangming Zhao Quanlong Feng Chaoqi Chen Zhen Zhou Yizhou Yu 32 30 0 19 Aug 2022
Challenges in Applying Robotics to Retail Store Management Vartika Sengar Aditya Kapoor Nijil George Vighnesh Vatsal J. Gubbi P. Balamuralidhar Arpan Pal 19 4 0 18 Aug 2022
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology Muhammad Hassan Haifei Guan Aikaterini Melliou Yuqi Wang Qianhui Sun ... Qi Huang Jiefu Tan Qinwang Xing Peiwu Qin Dongmei Yu NAI 26 14 0 31 Jul 2022
Hierarchical Symbolic Reasoning in Hyperbolic Space for Deep Discriminative Models Ainkaran Santhirasekaram Avinash Kori A. Rockall Mathias Winkler Francesca Toni Ben Glocker FAtt 27 4 0 05 Jul 2022
PROTOtypical Logic Tensor Networks (PROTO-LTN) for Zero Shot Learning Simone Martone Francesco Manigrasso Lamberti Fabrizio Lia Morra 19 3 0 26 Jun 2022
What is Right for Me is Not Yet Right for You: A Dataset for Grounding Relative Directions via Multi-Task Learning Jae Hee Lee Matthias Kerzel Kyra Ahrens C. Weber S. Wermter 27 8 0 05 May 2022
RelViT: Concept-guided Vision Transformer for Visual Relational Reasoning Xiaojian Ma Weili Nie Zhiding Yu Huaizu Jiang Chaowei Xiao Yuke Zhu Song-Chun Zhu Anima Anandkumar ViT LRM 22 19 0 24 Apr 2022
Theory of Graph Neural Networks: Representation and Learning Stefanie Jegelka GNN AI4CE 31 67 0 16 Apr 2022
An Algebraic Approach to Learning and Grounding Johanna Björklund Adam Dahlgren Lindström F. Drewes 17 0 0 06 Apr 2022
Do Vision-Language Pretrained Models Learn Composable Primitive Concepts? Tian Yun Usha Bhalla Ellie Pavlick Chen Sun ReLM CoGe VLM LRM 31 23 0 31 Mar 2022
FALCON: Fast Visual Concept Learning by Integrating Images, Linguistic descriptions, and Conceptual Relations Lingjie Mei Jiayuan Mao Ziqi Wang Chuang Gan J. Tenenbaum VLM 12 21 0 30 Mar 2022
Neuro-Symbolic Verification of Deep Neural Networks Xuan Xie Kristian Kersting Daniel Neider AAML NAI 16 15 0 02 Mar 2022
Measuring CLEVRness: Blackbox testing of Visual Reasoning Models Spyridon Mouselinos Henryk Michalewski Mateusz Malinowski 13 3 0 24 Feb 2022
HAKE: A Knowledge Engine Foundation for Human Activity Understanding Yong-Lu Li Xinpeng Liu Xiaoqian Wu Yizhuo Li Zuoyu Qiu Liang Xu Yue Xu Haoshu Fang Cewu Lu 16 38 0 14 Feb 2022
VAEL: Bridging Variational Autoencoders and Probabilistic Logic Programming Eleonora Misino G. Marra Emanuele Sansone 16 21 0 07 Feb 2022
Deep Learning Methods for Abstract Visual Reasoning: A Survey on Raven's Progressive Matrices Mikolaj Malkiñski Jacek Mañdziuk 109 41 0 28 Jan 2022
SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering Peixi Xiong Quanzeng You Pei Yu Zicheng Liu Ying Wu 10 5 0 25 Jan 2022
Visual Question Answering based on Formal Logic Muralikrishnna G. Sethuraman Ali Payani Faramarz Fekri J. C. Kerce NAI 13 3 0 08 Nov 2021
Dynamic Visual Reasoning by Learning Differentiable Physics Models from Video and Language Mingyu Ding Zhenfang Chen Tao Du Ping Luo J. Tenenbaum Chuang Gan VGen PINN OCL 22 74 0 28 Oct 2021
StructFormer: Learning Spatial Structure for Language-Guided Semantic Rearrangement of Novel Objects Weiyu Liu Chris Paxton Tucker Hermans D. Fox 17 89 0 19 Oct 2021