Are You Talking to Me? Reasoned Visual Dialog Generation through Adversarial Learning

21 November 2017

Qi Wu

Peng Wang

Chunhua Shen

Papers citing "Are You Talking to Me? Reasoned Visual Dialog Generation through Adversarial Learning"

50 / 58 papers shown

Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations

Wei Pang

Ruixue Duan

Jinfu Yang

Ning Li

145

13 Aug 2024

MAST: Video Polyp Segmentation with a Mixture-Attention Siamese Transformer

215

23 Jan 2024

Vision+X: A Survey on Multimodal Learning in the Light of DataIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Ye Zhu

Yuehua Wu

Andrii Zadaianchuk

Yan Yan

354

05 Oct 2022

Enabling Harmonious Human-Machine Interaction with Visual-Context Augmented Dialogue System: A Review

245

02 Jul 2022

The Dialog Must Go On: Improving Visual Dialog via Generative Self-TrainingComputer Vision and Pattern Recognition (CVPR), 2022

278

25 May 2022

Improving Cross-Modal Understanding in Visual Dialog via Contrastive LearningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Bo Xu

155

15 Apr 2022

Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog

164

10 Apr 2022

CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based Autonomous Urban DrivingAAAI Conference on Artificial Intelligence (AAAI), 2022

185

17 Feb 2022

OpenViDial 2.0: A Larger-Scale, Open-Domain Dialogue Generation Dataset with Visual Contexts

Jiwei Li

221

27 Sep 2021

Multimodal Incremental Transformer with Visual Grounding for Visual Dialogue Generation

Feilong Chen

Fandong Meng

Xiuyi Chen

Peng Li

Jie Zhou

180

17 Sep 2021

GoG: Relation-aware Graph-over-Graph Network for Visual Dialog

Feilong Chen

Xiuyi Chen

Fandong Meng

Peng Li

Jie Zhou

271

17 Sep 2021

Learning to Ground Visual Objects for Visual Dialog

189

13 Sep 2021

Saying the Unseen: Video Descriptions via Dialog AgentsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Ye Zhu

Yu Wu

Yi Yang

Yan Yan

212

26 Jun 2021

Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in VideosComputer Vision and Pattern Recognition (CVPR), 2021

145

23 Mar 2021

OpenViDial: A Large-Scale, Open-Domain Dialogue Dataset with Visual Contexts

Rui Yan

Jiwei Li

371

30 Dec 2020

Image Captioning with Context-Aware Auxiliary GuidanceAAAI Conference on Artificial Intelligence (AAAI), 2020

207

10 Dec 2020

Learning to Respond with Your Favorite Stickers: A Framework of Unifying Multi-Modality and User Preference in Multi-Turn Dialog

Rui Yan

207

05 Nov 2020

New Ideas and Trends in Deep Multimodal Content Understanding: A ReviewNeurocomputing (Neurocomputing), 2020

329

16 Oct 2020

A Linguistic Analysis of Visually Grounded Dialogues Based on Spatial Expressions

Takuma Udagawa

T. Yamazaki

Akiko Aizawa

224

07 Oct 2020

Dynamic Context-guided Capsule Network for Multimodal Machine TranslationACM Multimedia (ACM MM), 2020

Jie Zhou

219

04 Sep 2020

Co-Saliency Detection with Co-Attention Fully Convolutional Network

Guangshuai Gao

Wenting Zhao

Qingjie Liu

Yunhong Wang

152

20 Aug 2020

Describing Unseen Videos via Multi-Modal Cooperative Dialog Agents

Ye Zhu

Yu Wu

Yi Yang

Yan Yan

257

18 Aug 2020

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual DialogueACM Multimedia (ACM MM), 2020

266

11 Aug 2020

SeqDialN: Sequential Visual Dialog Networks in Joint Visual-Linguistic Representation SpaceWorkshop on Document-grounded Dialogue and Conversational Question Answering (DialDoc), 2020

Liu Yang

VLM

176

02 Aug 2020

Dynamic Graph Representation Learning for Video Dialog via Multi-Modal Shuffled Transformers

234

08 Jul 2020

DAM: Deliberation, Abandon and Memory Networks for Generating Detailed and Non-repetitive Responses in Visual Dialogue

Qi Wu

259

07 Jul 2020

Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation

Guolei Sun

Wenguan Wang

Jifeng Dai

Luc Van Gool

519

347

03 Jul 2020

ORD: Object Relationship Discovery for Visual Dialogue Generation

Ziwei Wang

Zi Huang

Yadan Luo

Huimin Lu

186

15 Jun 2020

VD-BERT: A Unified Vision and Dialog Transformer with BERTConference on Empirical Methods in Natural Language Processing (EMNLP), 2020

Yue Wang

Shafiq Joty

Michael R. Lyu

Irwin King

Caiming Xiong

Guosheng Lin

377

107

28 Apr 2020

A Revised Generative Evaluation of Visual Dialogue

164

20 Apr 2020

Iterative Context-Aware Graph Inference for Visual DialogComputer Vision and Pattern Recognition (CVPR), 2020

Meng Wang

219

05 Apr 2020

Learning to Respond with Stickers: A Framework of Unifying Multi-Modality in Multi-Turn DialogThe Web Conference (WWW), 2020

Dongyan Zhao

Rui Yan

219

10 Mar 2020

Guessing State Tracking for Visual DialogueEuropean Conference on Computer Vision (ECCV), 2020

Wei Pang

Xiaojie Wang

OOD

375

24 Feb 2020

See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese NetworksComputer Vision and Pattern Recognition (CVPR), 2019

Chao Ma

Fatih Porikli

264

521

19 Jan 2020

Modality-Balanced Models for Visual DialogueAAAI Conference on Artificial Intelligence (AAAI), 2020

Hyounghun Kim

Hao Tan

Joey Tianyi Zhou

110

17 Jan 2020

DMRM: A Dual-channel Multi-hop Reasoning Model for Visual DialogAAAI Conference on Artificial Intelligence (AAAI), 2019

Feilong Chen

Fandong Meng

Jiaming Xu

Peng Li

Bo Xu

Jie Zhou

177

18 Dec 2019

Large-scale Pretraining for Visual Dialog: A Simple State-of-the-Art BaselineEuropean Conference on Computer Vision (ECCV), 2019

Devi Parikh

349

120

05 Dec 2019

Efficient Attention Mechanism for Visual Dialog that can Handle All the Interactions between Multiple Inputs

Van-Quang Nguyen

Masanori Suganuma

Takayuki Okatani

263

26 Nov 2019

Two Causal Principles for Improving Visual DialogComputer Vision and Pattern Recognition (CVPR), 2019

590

159

24 Nov 2019

DualVD: An Adaptive Dual Encoding Model for Deep Visual Understanding in Visual DialogueAAAI Conference on Artificial Intelligence (AAAI), 2019

Qi Wu

194

17 Nov 2019

Multimodal Intelligence: Representation Learning, Information Fusion, and ApplicationsIEEE Journal on Selected Topics in Signal Processing (JSTSP), 2019

Chao Zhang

Zichao Yang

Xiaodong He

Li Deng

HAI AI4TS

319

401

10 Nov 2019

Granular Multimodal Attention Networks for Visual Dialog

Badri N. Patro

Shivansh Patel

Vinay P. Namboodiri

217

13 Oct 2019

Probabilistic framework for solving Visual DialogPattern Recognition (Pattern Recognit.), 2019

325

11 Sep 2019

Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and MethodsJournal of Artificial Intelligence Research (JAIR), 2019

404

142

22 Jul 2019

Factor Graph Attention

286

111

11 Apr 2019

A Simple Baseline for Audio-Visual Scene-Aware Dialog

Idan Schwartz

Alex Schwing

Tamir Hazan

203

11 Apr 2019

Reasoning Visual Dialogs with Structural and Partial Observations

237

119

11 Apr 2019

Generative Visual Dialogue System via Adaptive Reasoning and Weighted Likelihood Estimation

233

26 Feb 2019

Image-Question-Answer Synergistic Network for Visual DialogComputer Vision and Pattern Recognition (CVPR), 2019

Dalu Guo

Chang Xu

Dacheng Tao

168

26 Feb 2019

Dual Attention Networks for Visual Reference Resolution in Visual Dialog

Gi-Cheon Kang

Jaeseo Lim

Byoung-Tak Zhang

187

25 Feb 2019