Vision Transformers for Action Recognition: A Survey

Vision Transformers for Action Recognition: A Survey

13 September 2022

Ajmal Saeed Mian

Papers citing "Vision Transformers for Action Recognition: A Survey"

14 / 14 papers shown

Title
Artificial Behavior Intelligence: Technology, Challenges, and Future Directions Kanghyun Jo Jehwan Choi Kwanho Kim Seongmin Kim Duy-Linh Nguyen Xuan-Thuy Vo Adri Priadana Tien-Dat Tran AI4CE 29 0 0 06 May 2025
Can masking background and object reduce static bias for zero-shot action recognition? Takumi Fukuzawa Kensho Hara Hirokatsu Kataoka Toru Tamaki 32 0 0 22 Jan 2025
S3Aug: Segmentation, Sampling, and Shift for Action Recognition Taiki Sugiura Toru Tamaki AI4TS 19 2 0 23 Oct 2023
Cross-Enhancement Transformer for Action Segmentation Jiahui Wang Zhenyou Wang Shanna Zhuang Hui Wang ViT 38 23 0 19 May 2022
Omnivore: A Single Model for Many Visual Modalities Rohit Girdhar Mannat Singh Nikhil Ravi L. V. D. van der Maaten Armand Joulin Ishan Misra 209 222 0 20 Jan 2022
ASFormer: Transformer for Action Segmentation Fangqiu Yi Hongyu Wen Tingting Jiang ViT 66 168 0 16 Oct 2021
ActionCLIP: A New Paradigm for Video Action Recognition Mengmeng Wang Jiazheng Xing Yong Liu VLM 141 261 0 17 Sep 2021
STAR: Sparse Transformer-based Action Recognition Feng Shi Chonghan Lee Liang Qiu Yizhou Zhao Tianyi Shen Shivran Muralidhar Tian Han Song-Chun Zhu V. Narayanan ViT 13 21 0 15 Jul 2021
VidTr: Video Transformer Without Convolutions Yanyi Zhang Xinyu Li Chunhui Liu Bing Shuai Yi Zhu Biagio Brattoli Hao Chen I. Marsic Joseph Tighe ViT 119 178 0 23 Apr 2021
VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari Liangzhe Yuan Rui Qian Wei-Hong Chuang Shih-Fu Chang Yin Cui Boqing Gong ViT 229 573 0 22 Apr 2021
Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius Heng Wang Lorenzo Torresani ViT 275 1,939 0 09 Feb 2021
Relaxed Transformer Decoders for Direct Action Proposal Generation Jing Tan Jiaqi Tang Limin Wang Gangshan Wu ViT 67 175 0 03 Feb 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir F. Khan M. Shah ViT 216 2,404 0 04 Jan 2021
Effective Approaches to Attention-based Neural Machine Translation Thang Luong Hieu H. Pham Christopher D. Manning 211 7,687 0 17 Aug 2015