Learning to Localize Actions in Instructional Videos with LLM-Based Multi-Pathway Text-Video Alignment

22 September 2024

Yu Kong

Martin Renqiang Min

Dimitris N. Metaxas

Papers citing "Learning to Localize Actions in Instructional Videos with LLM-Based Multi-Pathway Text-Video Alignment"

1 / 1 papers shown

Title
VTD-CLIP: Video-to-Text Discretization via Prompting CLIP Wencheng Zhu Yuexin Wang Hongxuan Li Pengfei Zhu Q. Hu CLIP 48 0 0 24 Mar 2025