Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQA

AAAI Conference on Artificial Intelligence (AAAI), 2023

4 April 2023

Xin Li

Papers citing "Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQA"

1 / 1 papers shown

Title
Scene-Text Grounding for Text-Based Video Question Answering Sheng Zhou Junbin Xiao Xun Yang Peipei Song Dan Guo Angela Yao Meng Wang Tat-Seng Chua 659 3 0 22 Sep 2024