An Empirical Study of Training Self-Supervised Vision Transformers

5 April 2021

Papers citing "An Empirical Study of Training Self-Supervised Vision Transformers"

50 / 389 papers shown

Title
Joint Low-level and High-level Textual Representation Learning with Multiple Masking Strategies Zhengmi Tang Yuto Mitsui Tomo Miyazaki S. Omachi 34 0 0 11 May 2025
Learning Music Audio Representations With Limited Data Christos Plachouras Emmanouil Benetos Johan Pauwels 26 0 0 09 May 2025
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception Junjie Wang Bin Chen Yulin Li Bin Kang Y. Chen Zhuotao Tian VLM 38 0 0 07 May 2025
Token Coordinated Prompt Attention is Needed for Visual Prompting Zichen Liu Xu Zou Gang Hua Jiahuan Zhou 34 0 0 05 May 2025
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves D. Jiang Mengmeng Wang Liuzhuozheng Li Lei Zhang Haoyu Wang Wei Wei Guang Dai Yanning Zhang Jingdong Wang DiffM 51 0 0 05 May 2025
Lifelong Whole Slide Image Analysis: Online Vision-Language Adaptation and Past-to-Present Gradient Distillation Doanh C. Bui H. Pham V. Le T. Vu Van Duy Tran Khang Phuoc-Quy Nguyen Y. Nakashima CLL MedIm 26 0 0 04 May 2025
Self-Supervision Enhances Instance-based Multiple Instance Learning Methods in Digital Pathology: A Benchmark Study Ali Mammadov Loic Le Folgoc Julien Adam Anne Buronfosse Gilles Hayem Guillaume Hocquet Pietro Gori SSL 45 0 0 02 May 2025
MERA: Multimodal and Multiscale Self-Explanatory Model with Considerably Reduced Annotation for Lung Nodule Diagnosis Jiahao Lu Chong Yin Silvia Ingala Kenny Erleben M. Nielsen S. Darkner 49 0 0 27 Apr 2025
Multi-Resolution Pathology-Language Pre-training Model with Text-Guided Visual Representation Shahad Albastaki Anabia Sohail I. I. Ganapathi B. Alawode Asim Khan Sajid Javed N. Werghi Mohammed Bennamoun Arif Mahmood 66 0 0 26 Apr 2025
A Simple Review of EEG Foundation Models: Datasets, Advancements and Future Perspectives Junhong Lai Jiyu Wei Lin Yao Yueming Wang 43 0 0 24 Apr 2025
Search is All You Need for Few-shot Anomaly Detection Qishan Wang Jia Guo Shuyong Gao H. Wang Li Xiong J. Hu Hanqi Guo Wenqiang Zhang 53 0 0 16 Apr 2025
Evolved Hierarchical Masking for Self-Supervised Learning Zhanzhou Feng Shiliang Zhang 42 0 0 12 Apr 2025
Variational Self-Supervised Learning Mehmet Can Yavuz Berrin Yanikoglu SSL 100 0 0 06 Apr 2025
Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU Àlex Pujol Vidal Sergio Escalera Kamal Nasrollahi T. Moeslund MU 59 0 0 19 Mar 2025
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis Asifullah Khan Laiba Asmatullah Anza Malik Shahzaib Khan Hamna Asif SSL VLM 74 0 0 14 Mar 2025
Implicit Contrastive Representation Learning with Guided Stop-gradient Byeongchan Lee Sehyun Lee SSL 89 2 0 12 Mar 2025
A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning Xin Wen Bingchen Zhao Yilun Chen Jiangmiao Pang Xiaojuan Qi LM&Ro 44 0 0 10 Mar 2025
MIRAM: Masked Image Reconstruction Across Multiple Scales for Breast Lesion Risk Prediction H. Q. Vo Pengyu Yuan Zheng Yin Kelvin K. Wong Chika F. Ezeana S. Ly Stephen T. C. Wong H. Nguyen 43 0 0 10 Mar 2025
WeakSupCon: Weakly Supervised Contrastive Learning for Encoder Pre-training Bodong Zhang Hamid Manoochehri Beatrice S. Knudsen Tolga Tasdizen SSL 73 0 0 06 Mar 2025
AirExo-2: Scaling up Generalizable Robotic Imitation Learning with Low-Cost Exoskeletons Hongjie Fang Chenxi Wang Yiming Wang J. Chen Shangning Xia ... Xinyu Zhan Lixin Yang Weiming Wang Cewu Lu Hao-Shu Fang 82 1 0 05 Mar 2025
MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations Benedikt Alkin Lukas Miklautz Sepp Hochreiter Johannes Brandstetter VLM 65 8 0 24 Feb 2025
Artificial Kuramoto Oscillatory Neurons Takeru Miyato Sindy Lowe Andreas Geiger Max Welling AI4CE 72 6 0 17 Feb 2025
Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model Jiarui Jin Haoyu Wang Hongyan Li Jun Yu Li Jiahui Pan Shenda Hong 41 5 0 15 Feb 2025
UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation Tao Zhang Jinyong Wen Zhen Chen Kun Ding S. Xiang Chunhong Pan 72 1 0 04 Feb 2025
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity Zahra Gharaee Scott C. Lowe ZeMing Gong Pablo Millán Arias Nicholas Pellegrino ... Lila Kari Dirk Steinke Graham W. Taylor Paul Fieguth Angel X. Chang 48 7 0 28 Jan 2025
Self-supervised Benchmark Lottery on ImageNet: Do Marginal Improvements Translate to Improvements on Similar Datasets? Utku Ozbulak Esla Timothy Anzaku Solha Kang W. D. Neve J. Vankerschaver 50 0 0 28 Jan 2025
QCS: Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition C. Wang Li Chen Lili Wang Zhaofan Li Xuebin Lv 78 1 0 28 Jan 2025
Robust Representation Consistency Model via Contrastive Denoising Jiachen Lei Julius Berner Jiongxiao Wang Zhongzhu Chen Zhongjia Ba Kui Ren Jun Zhu Anima Anandkumar DiffM 77 0 0 22 Jan 2025
Slot-BERT: Self-supervised Object Discovery in Surgical Video Guiqiu Liao M. Jogan Marcel Hussing Kenta Nakahashi Kazuhiro Yasufuku Amin Madani Eric Eaton Daniel A. Hashimoto 127 0 0 21 Jan 2025
The "Law" of the Unconscious Contrastive Learner: Probabilistic Alignment of Unpaired Modalities Yongwei Che Benjamin Eysenbach 33 1 0 20 Jan 2025
Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models Yifan Zhang Junhui Hou 66 1 0 03 Jan 2025
Enhancing Contrastive Learning Inspired by the Philosophy of "The Blind Men and the Elephant" Yudong Zhang Ruobing Xie Jiansheng Chen X. Sun Zhanhui Kang Yu Wang 83 0 0 21 Dec 2024
Wearable Accelerometer Foundation Models for Health via Knowledge Distillation Salar Abbaspourazad Anshuman Mishra Joseph D. Futoma Andrew C. Miller Ian Shapiro 88 0 0 15 Dec 2024
Beyond [cls]: Exploring the true potential of Masked Image Modeling representations Marcin Przewiȩźlikowski Randall Balestriero Wojciech Jasiński Marek 'Smieja Bartosz Zieliñski 69 0 0 04 Dec 2024
Tra-MoE: Learning Trajectory Prediction Model from Multiple Domains for Adaptive Policy Conditioning Jiange Yang Haoyi Zhu Y. Wang Gangshan Wu Tong He Limin Wang 95 2 0 21 Nov 2024
Unsupervised Foundation Model-Agnostic Slide-Level Representation Learning Tim Lenz Peter Neidlinger M. Ligero Georg Wolflein M. Treeck Jakob Nikolas Kather 73 1 0 20 Nov 2024
Label Distribution Shift-Aware Prediction Refinement for Test-Time Adaptation M-U Jang Hye Won Chung TTA 171 0 0 20 Nov 2024
Masked Autoencoders are Parameter-Efficient Federated Continual Learners Yuchen He Xiangfeng Wang CLL FedML 31 0 0 04 Nov 2024
ViMoE: An Empirical Study of Designing Vision Mixture-of-Experts Xumeng Han Longhui Wei Zhiyang Dou Zipeng Wang Chenhui Qiang Xin He Yingfei Sun Zhenjun Han Qi Tian MoE 37 3 0 21 Oct 2024
Locality Alignment Improves Vision-Language Models Ian Covert Tony Sun James Y. Zou Tatsunori Hashimoto VLM 67 3 0 14 Oct 2024
SPA: 3D Spatial-Awareness Enables Effective Embodied Representation Haoyi Zhu Honghui Yang Yating Wang Jiange Yang Limin Wang Tong He 3DH 48 6 0 10 Oct 2024
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think Sihyun Yu Sangkyung Kwak Huiwon Jang Jongheon Jeong Jonathan Huang Jinwoo Shin Saining Xie OCL 70 62 0 09 Oct 2024
Compositional Entailment Learning for Hyperbolic Vision-Language Models Avik Pal Max van Spengler Guido Maria DÁmely di Melendugno Alessandro Flaborea Fabio Galasso Pascal Mettes CoGe 40 5 0 09 Oct 2024
Geometric Representation Condition Improves Equivariant Molecule Generation Zian Li Cai Zhou Xiyuan Wang Xingang Peng Muhan Zhang 45 1 0 04 Oct 2024
Denoising with a Joint-Embedding Predictive Architecture Dengsheng Chen Jie Hu Xiaoming Wei Enhua Wu DiffM 52 2 0 02 Oct 2024
ProMerge: Prompt and Merge for Unsupervised Instance Segmentation Dylan Li Gyungin Shin 27 3 0 27 Sep 2024
RingMo-Aerial: An Aerial Remote Sensing Foundation Model With A Affine Transformation Contrastive Learning Wenhui Diao Haichen Yu Kaiyue Kang Tong Ling Di Liu ... Hanbo Bi Libo Ren Xuexue Li Yongqiang Mao Xian Sun 31 1 0 20 Sep 2024
DynaMo: In-Domain Dynamics Pretraining for Visuo-Motor Control Zichen Jeff Cui Hengkai Pan Aadhithya Iyer Siddhant Haldar Lerrel Pinto VGen 26 10 0 18 Sep 2024
IMRL: Integrating Visual, Physical, Temporal, and Geometric Representations for Enhanced Food Acquisition Rui Liu Zahiruddin Mahammad Amisha Bhaskar Pratap Tokekar 23 1 0 18 Sep 2024
Phikon-v2, A large and public feature extractor for biomarker prediction Alexandre Filiot Paul Jacob Alice Mac Kain Charlie Saillard MedIm 36 17 0 13 Sep 2024