Actor-Centric Relation Network

28 July 2018

Carl Vondrick

Papers citing "Actor-Centric Relation Network"

50 / 131 papers shown

Title
Domain-Adaptive Pretraining Improves Primate Behavior Recognition Felix B. Mueller Timo Lueddecke Richard Vogg Alexander S. Ecker 81 1 0 15 Sep 2025
Spatial-Temporal Human-Object Interaction DetectionIEEE International Conference on Multimedia and Expo (ICME), 2021 Xu Sun Yunqing He Tongwei Ren Gangshan Wu 48 4 0 24 Aug 2025
Dual Guidance Semi-Supervised Action Detection Ankit Singh E. Gavves Cees G. M. Snoek Hilde Kuehne 111 0 0 28 Jul 2025
Action tube generation by person query matching for spatio-temporal action detection Kazuki Omi Jion Oshima Toru Tamaki 327 0 0 17 Mar 2025
Exploiting VLM Localizability and Semantics for Open Vocabulary Action DetectionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024 Wentao Bao Keqin Li Yuxiao Chen Deep Patel Martin Renqiang Min Yu Kong VLM ObjD 248 7 0 17 Nov 2024
ROAD-Waymo: Action Awareness at Scale for Autonomous Driving Salman Khan Izzeddin Teeti Reza Javanmard Alitappeh Mihaela C. Stoian Eleonora Giunchiglia Gurkirt Singh Andrew Bradley Fabio Cuzzolin 229 2 0 03 Nov 2024
AlphaChimp: Tracking and Behavior Recognition of Chimpanzees Xiaoxuan Ma Yutang Lin Yuan Xu Stephan P. Kaufhold Jack Terwilliger Andres Meza Yixin Zhu Federico Rossano Yizhou Wang 357 4 0 22 Oct 2024
Query matching for spatio-temporal action detection with query-based object detector Shimon Hori Kazuki Omi Toru Tamaki 147 1 0 27 Sep 2024
AMEGO: Active Memory from long EGOcentric videosEuropean Conference on Computer Vision (ECCV), 2024 Gabriele Goletto Tushar Nagarajan Giuseppe Averta Dima Damen EgoV 204 18 0 17 Sep 2024
Spatio-Temporal Context Prompting for Zero-Shot Action DetectionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024 Wei-Jhe Huang Min-Hung Chen Shang-Hong Lai 229 2 0 28 Aug 2024
JARViS: Detecting Actions in Video Using Unified Actor-Scene Context Relation Modeling Seok Hwan Lee Taein Son Soo Won Seo Jisong Kim Jun Won Choi 267 1 0 07 Aug 2024
Classification Matters: Improving Video Action Detection with Class-Specific AttentionEuropean Conference on Computer Vision (ECCV), 2024 Jinsung Lee Taeoh Kim Inwoong Lee Minho Shim Dongyoon Wee Minsu Cho Suha Kwak 328 1 0 29 Jul 2024
Open-Vocabulary Spatio-Temporal Action Detection Tao Wu Shuqiu Ge Jie Qin Gangshan Wu Limin Wang ObjD 147 9 0 17 May 2024
A Semantic and Motion-Aware Spatiotemporal Transformer Network for Action DetectionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024 Matthew Korban Peter Youngs Scott T. Acton ViT 198 13 0 13 May 2024
Multi-view Action Recognition via Directed Gromov-Wasserstein Discrepancy Hoang-Quan Nguyen Thanh-Dat Truong Khoa Luu 251 1 0 02 May 2024
SFMViT: SlowFast Meet ViT in Chaotic World Jiaying Lin Jiajun Wen Mengyuan Liu Jinfu Liu Baiqiao Yin Yue Li ViT 150 1 0 25 Apr 2024
STMixer: A One-Stage Sparse Action Detector Tao Wu Mengqing Cao Ziteng Gao Gangshan Wu Limin Wang 190 36 0 15 Apr 2024
Computer Vision for Primate Behavior Analysis in the Wild Richard Vogg Timo Lüddecke Jonathan Henrich Sharmita Dey Matthias Nuske ... Alexander Gail Stefan Treue H. Scherberger Florentin Wörgötter Alexander S. Ecker 376 14 0 29 Jan 2024
Understanding Video Transformers via Universal Concept Discovery M. Kowal Achal Dave Rares Andrei Ambrus Adrien Gaidon Konstantinos G. Derpanis P. Tokmakov ViT 324 16 0 19 Jan 2024
Multiscale Vision Transformers meet Bipartite Matching for efficient single-stage Action LocalizationComputer Vision and Pattern Recognition (CVPR), 2023 Ioanna Ntinou Enrique Sanchez Georgios Tzimiropoulos 194 7 0 29 Dec 2023
Semi-supervised Active Learning for Video Action DetectionAAAI Conference on Artificial Intelligence (AAAI), 2023 Aayush Singh A. J. Rana Akash Kumar Shruti Vyas Yogesh S Rawat 369 16 0 12 Dec 2023
Memory-Efficient Optical Flow via Radius-Distribution Orthogonal Cost Volume Gangwei Xu Shujun Chen Hao Jia Miaojie Feng Xin Yang 209 8 0 06 Dec 2023
Object-centric Video Representation for Long-term Action AnticipationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023 Ce Zhang Changcheng Fu Shijie Wang Nakul Agarwal Kwonjoon Lee Chiho Choi Chen Sun 223 29 0 31 Oct 2023
ChimpACT: A Longitudinal Dataset for Understanding Chimpanzee BehaviorsNeural Information Processing Systems (NeurIPS), 2023 Xiaoxuan Ma Stephan P. Kaufhold Jiajun Su Wentao Zhu Jack Terwilliger Andres Meza Yixin Zhu Federico Rossano Yizhou Wang 178 26 0 25 Oct 2023
A Grammatical Compositional Model for Video Action Detection Zhijun Zhang Xu Zou Jiahuan Zhou Sheng Zhong Ying Wu 188 0 0 04 Oct 2023
Helping Hands: An Object-Aware Ego-Centric Video Recognition ModelIEEE International Conference on Computer Vision (ICCV), 2023 Chuhan Zhang Ankush Gupta Andrew Zisserman VLM 168 34 0 15 Aug 2023
A Survey on Deep Learning-based Spatio-temporal Action Detection Peng Wang Fanwei Zeng Yu Qian 188 8 0 03 Aug 2023
Human-to-Human Interaction DetectionInternational Conference on Neural Information Processing (ICONIP), 2023 Zhenhua Wang Kaining Ying Jiajun Meng J. Ning 277 3 0 02 Jul 2023
Incorporating Structured Representations into Pretrained Vision & Language Models Using Scene GraphsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Roei Herzig Alon Mendelson Leonid Karlinsky Assaf Arbelle Rogerio Feris Trevor Darrell Amir Globerson VLM 267 38 0 10 May 2023
Modelling Spatio-Temporal Interactions for Compositional Action Recognition Ramanathan Rajendiran Debaditya Roy Basura Fernando 176 1 0 04 May 2023
End-to-End Spatio-Temporal Action Localisation with Video TransformersComputer Vision and Pattern Recognition (CVPR), 2023 A. Gritsenko Xuehan Xiong Josip Djolonga Mostafa Dehghani Chen Sun Mario Lucic Cordelia Schmid Anurag Arnab ViT 199 20 0 24 Apr 2023
MRSN: Multi-Relation Support Network for Video Action DetectionIEEE International Conference on Multimedia and Expo (ICME), 2023 Yin-Dong Zheng Guo Chen Minglei Yuan Tong Lu 212 9 0 24 Apr 2023
Efficient Video Action Detection with Token Dropout and Context RefinementIEEE International Conference on Computer Vision (ICCV), 2023 Lei Chen Zhan Tong Yibing Song Gangshan Wu Limin Wang 249 25 0 17 Apr 2023
DOAD: Decoupled One Stage Action Detection Network Shuning Chang Pichao Wang Fan Wang Jiashi Feng Mike Zheng Show 154 6 0 01 Apr 2023
CycleACR: Cycle Modeling of Actor-Context Relations for Video Action DetectionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023 Lei Chen Zhan Tong Yibing Song Gangshan Wu Limin Wang 151 3 0 28 Mar 2023
Open Set Action Recognition via Multi-Label Evidential LearningComputer Vision and Pattern Recognition (CVPR), 2023 Chen Zhao Dawei Du A. Hoogs Christopher Funk EDL 139 35 0 27 Feb 2023
PromptonomyViT: Multi-Task Prompt Learning Improves Video Transformers using Synthetic Scene DataIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022 Roei Herzig Ofir Abramovich Elad Ben-Avraham Assaf Arbelle Leonid Karlinsky Ariel Shamir Trevor Darrell Amir Globerson 316 20 0 08 Dec 2022
Holistic Interaction Transformer Network for Action DetectionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022 Gueter Josmy Faure Min-Hung Chen S. Lai 251 48 0 23 Oct 2022
Grounded Video Situation RecognitionNeural Information Processing Systems (NeurIPS), 2022 Zeeshan Khan C. V. Jawahar Makarand Tapaswi 174 15 0 19 Oct 2022
Is an Object-Centric Video Representation Beneficial for Transfer?Asian Conference on Computer Vision (ACCV), 2022 Chuhan Zhang Ankush Gupta Andrew Zisserman ViT 294 30 0 20 Jul 2022
Beyond Transfer Learning: Co-finetuning for Action Localisation Anurag Arnab Xuehan Xiong A. Gritsenko Rob Romijnders Josip Djolonga Mostafa Dehghani Chen Sun Mario Lucic Cordelia Schmid 238 10 0 08 Jul 2022
Do Trajectories Encode Verb Meaning?North American Chapter of the Association for Computational Linguistics (NAACL), 2022 Dylan Ebert Chen Sun Ellie Pavlick 141 2 0 23 Jun 2022
Explore Spatio-temporal Aggregation for Insubstantial Object Detection: Benchmark Dataset and BaselineComputer Vision and Pattern Recognition (CVPR), 2022 Kailai Zhou Yibo Wang Tao Lv Yunqian Li Linsen Chen Qiu Shen Xun Cao 170 17 0 23 Jun 2022
Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens Elad Ben-Avraham Roei Herzig K. Mangalam Amir Bar Anna Rohrbach Leonid Karlinsky Trevor Darrell Amir Globerson 214 0 0 13 Jun 2022
A Simple and Efficient Pipeline to Build an End-to-End Spatial-Temporal Action DetectorIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022 Lin Sui Chen-Da Liu-Zhang Lixin Gu Feng Han 233 12 0 07 Jun 2022
A Multi-Person Video Dataset Annotation Method of Spatio-Temporally Actions Fan Yang 197 5 0 21 Apr 2022
Hierarchical Self-supervised Representation Learning for Movie UnderstandingComputer Vision and Pattern Recognition (CVPR), 2022 Fanyi Xiao Kaustav Kundu Joseph Tighe Davide Modolo SSL 173 27 0 06 Apr 2022
CRAFT: Cross-Attentional Flow Transformer for Robust Optical FlowComputer Vision and Pattern Recognition (CVPR), 2022 Xiuchao Sui Shaohua Li Xue Geng Yan Wu Xinxing Xu Yong Liu Rick Siow Mong Goh Erik Cambria ViT 206 121 0 31 Mar 2022
Point3D: tracking actions as moving points with 3D CNNsBritish Machine Vision Conference (BMVC), 2022 Shentong Mo Jingfei Xia Xiaoqing Ellen Tan Bhiksha Raj 3DPC 200 5 0 20 Mar 2022
End-to-End Semi-Supervised Learning for Video Action DetectionComputer Vision and Pattern Recognition (CVPR), 2022 Akash Kumar Yogesh S Rawat 188 37 0 08 Mar 2022