Chunk-aware Alignment and Lexical Constraint for Visual Entailment with
Natural Language Explanations

Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language Explanations

23 July 2022

Baotian Hu

Lin Ma

Min Zhang

Papers citing "Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language Explanations"

11 / 11 papers shown

Title
Retrieval-Augmented Natural Language Reasoning for Explainable Visual Question Answering Su Hyeon Lim Minkuk Kim Hyeon Bae Kim Seong Tae Kim ReLM LRM 25 0 0 30 Aug 2024
FSMR: A Feature Swapping Multi-modal Reasoning Approach with Joint Textual and Visual Clues Shuang Li Jiahua Wang Lijie Wen LRM 14 0 0 29 Mar 2024
VEglue: Testing Visual Entailment Systems via Object-Aligned Joint Erasing Zhiyuan Chang Mingyang Li Junjie Wang Cheng Li Qing Wang 22 0 0 05 Mar 2024
Towards More Faithful Natural Language Explanation Using Multi-Level Contrastive Learning in VQA Chengen Lai Shengli Song Shiqi Meng Jingyang Li Sitong Yan Guangneng Hu 10 5 0 21 Dec 2023
TILFA: A Unified Framework for Text, Image, and Layout Fusion in Argument Mining Qing Zong Zhaowei Wang Baixuan Xu Tianshi Zheng Haochen Shi Weiqi Wang Yangqiu Song Ginny Y. Wong Simon See 8 4 0 08 Oct 2023
S3C: Semi-Supervised VQA Natural Language Explanation via Self-Critical Learning Wei Suo Mengyang Sun Weisong Liu Yi-Meng Gao Peifeng Wang Yanning Zhang Qi Wu LRM 17 7 0 05 Sep 2023
A Multi-Modal Context Reasoning Approach for Conditional Inference on Joint Textual and Visual Clues Yunxin Li Baotian Hu Xinyu Chen Yuxin Ding Lin Ma Min Zhang LRM 35 14 0 08 May 2023
Enhancing Multi-modal and Multi-hop Question Answering via Structured Knowledge and Unified Retrieval-Generation Qian Yang Qian Chen Wen Wang Baotian Hu Min Zhang 12 24 0 16 Dec 2022
Beyond VQA: Generating Multi-word Answer and Rationale to Visual Questions Radhika Dua Sai Srinivas Kancheti V. Balasubramanian LRM 30 22 0 24 Oct 2020
e-SNLI: Natural Language Inference with Natural Language Explanations Oana-Maria Camburu Tim Rocktaschel Thomas Lukasiewicz Phil Blunsom LRM 249 618 0 04 Dec 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 141 1,458 0 06 Jun 2016