Multimedia Generative Script Learning for Task Planning

Multimedia Generative Script Learning for Task Planning

25 August 2022

Qingyun Wang

Girish Chowdhary

Heng Ji

Papers citing "Multimedia Generative Script Learning for Task Planning"

8 / 8 papers shown

Title
Long-horizon Visual Instruction Generation with Logic and Attribute Self-reflection Yucheng Suo Fan Ma Kaixin Shen Linchao Zhu Yi Yang VLM 47 0 0 12 Mar 2025
Chem-FINESE: Validating Fine-Grained Few-shot Entity Extraction through Text Reconstruction Qingyun Wang Zixuan Zhang Hongxiang Li Xuan Liu Jiawei Han Huimin Zhao Heng Ji 41 1 0 18 Jan 2024
Procedure-Aware Pretraining for Instructional Video Understanding Honglu Zhou Roberto Martín-Martín Mubbasir Kapadia Silvio Savarese Juan Carlos Niebles 23 38 0 31 Mar 2023
CoNT: Contrastive Neural Text Generation Chen An Jiangtao Feng Kai Lv Lingpeng Kong Xipeng Qiu Xuanjing Huang 59 23 0 29 May 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 388 4,110 0 28 Jan 2022
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 273 1,077 0 17 Feb 2021
Unifying Vision-and-Language Tasks via Text Generation Jaemin Cho Jie Lei Hao Tan Mohit Bansal MLLM 249 525 0 04 Feb 2021
Augmented SBERT: Data Augmentation Method for Improving Bi-Encoders for Pairwise Sentence Scoring Tasks Nandan Thakur Nils Reimers Johannes Daxenberger Iryna Gurevych 197 237 0 16 Oct 2020