v1v2 (latest)

Recursive Visual Attention in Visual Dialog

6 December 2018

ArXiv (abs)PDF HTML Github (64★)

Papers citing "Recursive Visual Attention in Visual Dialog"

50 / 65 papers shown

Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations

Wei Pang

Ruixue Duan

Jinfu Yang

Ning Li

148

13 Aug 2024

BI-MDRG: Bridging Image History in Multimodal Dialogue Response GenerationEuropean Conference on Computer Vision (ECCV), 2024

Yu-Jung Heo

Chang D. Yoo

222

12 Aug 2024

Mining Fine-Grained Image-Text Alignment for Zero-Shot Captioning via Text-Only Training

212

04 Jan 2024

$$\mathbb{VD}$-$\mathbb{GR}$: Boosting $\mathbb{V}$isual $\mathbb{D}$ialog with Cascaded Spatial-Temporal Multi-Modal $\mathbb{GR}$aphs$

\mathbb{VD}

\mathbb{GR}

: Boosting

\mathbb{V}

isual

\mathbb{D}

ialog with Cascaded Spatial-Temporal Multi-Modal

\mathbb{GR}

aphsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

171

25 Oct 2023

Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog

Haoyu Zhang

384

11 Oct 2023

VDialogUE: A Unified Evaluation Benchmark for Visually-grounded Dialogue

Yunshui Li

Run Luo

Min Yang

Fei Huang

Yongbin Li

160

14 Sep 2023

Unified Multimodal Model with Unlikelihood Training for Visual DialogACM Multimedia (ACM MM), 2022

187

23 Nov 2022

MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain ConversationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Dongyan Zhao

255

10 Nov 2022

Learning to Collocate Visual-Linguistic Neural Modules for Image CaptioningInternational Journal of Computer Vision (IJCV), 2022

Jianfei Cai

273

04 Oct 2022

Neuro-Symbolic Visual DialogInternational Conference on Computational Linguistics (COLING), 2022

193

22 Aug 2022

Adversarial Robustness of Visual Dialog

Lu Yu

Verena Rieser

AAML

192

06 Jul 2022

Enabling Harmonious Human-Machine Interaction with Visual-Context Augmented Dialogue System: A Review

245

02 Jul 2022

VD-PCR: Improving Visual Dialog with Pronoun Coreference ResolutionPattern Recognition (Pattern Recogn.), 2022

184

29 May 2022

The Dialog Must Go On: Improving Visual Dialog via Generative Self-TrainingComputer Vision and Pattern Recognition (CVPR), 2022

290

25 May 2022

Learning to Retrieve Videos by Asking QuestionsACM Multimedia (ACM MM), 2022

Avinash Madasu

Junier Oliva

Gedas Bertasius

VGen

316

11 May 2022

UTC: A Unified Transformer with Inter-Task Contrastive Learning for Visual DialogComputer Vision and Pattern Recognition (CVPR), 2022

Xin Jiang

Qun Liu

X. Gu

267

01 May 2022

Supplementing Missing Visions via Dialog for Scene Graph GenerationsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Yan Yan

197

23 Apr 2022

Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog

164

10 Apr 2022

Affective Feedback Synthesis Towards Multimodal Text and Image Data

Balasubramanian Raman

EGVM

249

23 Mar 2022

Spot the Difference: A Cooperative Object-Referring Game in Non-Perfectly Co-Observable Scene

Jie Zhou

183

16 Mar 2022

Modeling Coreference Relations in Visual DialogConference of the European Chapter of the Association for Computational Linguistics (EACL), 2022

Mingxiao Li

Marie-Francine Moens

127

06 Mar 2022

A Review of the Gumbel-max Trick and its Extensions for Discrete Stochasticity in Machine Learning

336

129

04 Oct 2021

OpenViDial 2.0: A Larger-Scale, Open-Domain Dialogue Generation Dataset with Visual Contexts

Jiwei Li

221

27 Sep 2021

Multimodal Incremental Transformer with Visual Grounding for Visual Dialogue Generation

Feilong Chen

Fandong Meng

Xiuyi Chen

Peng Li

Jie Zhou

183

17 Sep 2021

GoG: Relation-aware Graph-over-Graph Network for Visual Dialog

Feilong Chen

Xiuyi Chen

Fandong Meng

Peng Li

Jie Zhou

271

17 Sep 2021

Learning to Ground Visual Objects for Visual Dialog

192

13 Sep 2021

Exophoric Pronoun Resolution in Dialogues with Topic RegularizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Kun Xu

Dong Yu

151

10 Sep 2021

Enhancing Visual Dialog Questioner with Entity-based Strategy Learning and Augmented GuesserConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Jie Zhou

140

06 Sep 2021

Communicative Learning with Natural Gestures for Embodied Navigation Agents with Human-in-the-SceneIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2021

Qi Wu

Cheng-Ju Wu

Yixin Zhu

Jungseock Joo

242

05 Aug 2021

Modeling Explicit Concerning States for Reinforcement Learning in Visual Dialogue

Jie Zhou

169

12 Jul 2021

Modeling Text-visual Mutual Dependency for Multi-modal Dialog Generation

Rui Yan

Jiwei Li

220

30 May 2021

Ensemble of MRR and NDCG models for Visual DialogNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

Idan Schwartz

272

15 Apr 2021

Structured Co-reference Graph Attention for Video-grounded DialogueAAAI Conference on Artificial Intelligence (AAAI), 2021

202

24 Mar 2021

OpenViDial: A Large-Scale, Open-Domain Dialogue Dataset with Visual Contexts

Rui Yan

Jiwei Li

371

30 Dec 2020

DTGAN: Dual Attention Generative Adversarial Networks for Text-to-Image Generation

Zhenxing Zhang

Lambert Schomaker

GAN

260

05 Nov 2020

Multimodal Research in Vision and Language: A Review of Current and Emerging Trends

Roger Zimmermann

277

19 Oct 2020

A Linguistic Analysis of Visually Grounded Dialogues Based on Spatial Expressions

Takuma Udagawa

T. Yamazaki

Akiko Aizawa

224

07 Oct 2020

Describing Unseen Videos via Multi-Modal Cooperative Dialog Agents

Ye Zhu

Yu Wu

Yi Yang

Yan Yan

264

18 Aug 2020

KBGN: Knowledge-Bridge Graph Network for Adaptive Vision-Text Reasoning in Visual DialogueACM Multimedia (ACM MM), 2020

269

11 Aug 2020

SeqDialN: Sequential Visual Dialog Networks in Joint Visual-Linguistic Representation SpaceWorkshop on Document-grounded Dialogue and Conversational Question Answering (DialDoc), 2020

Liu Yang

VLM

179

02 Aug 2020

DAM: Deliberation, Abandon and Memory Networks for Generating Detailed and Non-repetitive Responses in Visual Dialogue

Qi Wu

261

07 Jul 2020

ORD: Object Relationship Discovery for Visual Dialogue Generation

Ziwei Wang

Zi Huang

Yadan Luo

Huimin Lu

186

15 Jun 2020

History for Visual Dialog: Do we really need it?

133

08 May 2020

VD-BERT: A Unified Vision and Dialog Transformer with BERTConference on Empirical Methods in Natural Language Processing (EMNLP), 2020

Yue Wang

Shafiq Joty

Michael R. Lyu

Irwin King

Caiming Xiong

Guosheng Lin

385

107

28 Apr 2020

A Revised Generative Evaluation of Visual Dialogue

169

20 Apr 2020

Reasoning Visual Dialog with Sparse Graph Learning and Knowledge TransferConference on Empirical Methods in Natural Language Processing (EMNLP), 2020

206

14 Apr 2020

Iterative Context-Aware Graph Inference for Visual DialogComputer Vision and Pattern Recognition (CVPR), 2020

Meng Wang

222

05 Apr 2020

Vision-Dialog Navigation by Exploring Cross-modal MemoryComputer Vision and Pattern Recognition (CVPR), 2020

Xiaojun Chang

Xiaodan Liang

VLM

179

15 Mar 2020

Counterfactual Samples Synthesizing for Robust Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2020

386

319

14 Mar 2020

Toward Interpretability of Dual-Encoder Models for Dialogue Response Suggestions

130

02 Mar 2020