Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2305.03204
Cited By

VideoOFA: Two-Stage Pre-Training for Video-to-Text Generation

VideoOFA: Two-Stage Pre-Training for Video-to-Text Generation

4 May 2023

Yashar Mehdad

ArXiv (abs)PDF HTML

Papers citing "VideoOFA: Two-Stage Pre-Training for Video-to-Text Generation"

2 / 2 papers shown

SyncFlow: Toward Temporally Aligned Joint Audio-Video Generation from
Text

SyncFlow: Toward Temporally Aligned Joint Audio-Video Generation from Text

Varun K. Nagaraja

Mark D. Plumbley

347

12

0

03 Dec 2024

Mirasol3B: A Multimodal Autoregressive model for time-aligned and
contextual modalities

Mirasol3B: A Multimodal Autoregressive model for time-aligned and contextual modalitiesComputer Vision and Pattern Recognition (CVPR), 2023

A. Piergiovanni

Michael S. Ryoo

375

25

0

09 Nov 2023