v1v2 (latest)

EndoNet: A Deep Architecture for Recognition Tasks on Laparoscopic Videos

9 February 2016

Papers citing "EndoNet: A Deep Architecture for Recognition Tasks on Laparoscopic Videos"

50 / 324 papers shown

Title
Rethinking Surgical Smoke: A Smoke-Type-Aware Laparoscopic Video Desmoking Method and Dataset Qifan Liang Junlin Li Zhen Han X. Wang Zhongyuan Wang Bin Mei 72 0 0 02 Dec 2025
Comparing SAM 2 and SAM 3 for Zero-Shot Segmentation of 3D Medical Data Satrajit Chakrabarty Ravi Soni MedIm VLM 163 0 0 26 Nov 2025
SurgMLLMBench: A Multimodal Large Language Model Benchmark Dataset for Surgical Scene Understanding Tae-Min Choi Tae Kyeong Jeong Garam Kim Jaemin Lee Yeongyoon Koh In Cheul Choi Jae-Ho Chung Jong Woong Park Juyoun Park 133 0 0 26 Nov 2025
CataractCompDetect: Intraoperative Complication Detection in Cataract Surgery Bhuvan Sachdeva Sneha Kumari Rudransh Agarwal Shalaka Kumaraswamy Niharika Singri Prasad ... Raphael Lechtenboehmer M. Wintergerst T. Schultz K. Murali Mohit Jain 76 0 0 24 Nov 2025
Video Dataset for Surgical Phase, Keypoint, and Instrument Recognition in Laparoscopic Surgery (PhaKIR) Tobias Rueckert Raphaela Maerkl D. Rauber Leonard Klausmann Max Gutbrod Daniel Rueckert Hubertus Feussner Dirk Wilhelm Christoph Palm 52 0 0 09 Nov 2025
SurgiATM: A Physics-Guided Plug-and-Play Model for Deep Learning-Based Smoke Removal in Laparoscopic Surgery Mingyu Sheng Jianan Fan Dongnan Liu Guoyan Zheng Ron Kikinis Weidong (Tom) Cai 149 0 0 07 Nov 2025
T-FIX: Text-Based Explanations with Features Interpretable to eXperts Shreya Havaldar Helen Jin Chaehyeon Kim Anton Xue Weiqiu You ... Rajat Deo Sameed Ahmed M. Khatana Gary E. Weissman Lyle Ungar Eric Wong 112 0 0 06 Nov 2025
Adaptive transfer learning for surgical tool presence detection in laparoscopic videos through gradual freezing fine-tuning Ana Davila Jacinto Colan Y. Hasegawa 127 0 0 17 Oct 2025
State-Change Learning for Prediction of Future Events in Endoscopic Videos Saurav Sharma C. Nwoye Didier Mutter N. Padoy 141 0 0 14 Oct 2025
Mitigating Surgical Data Imbalance with Dual-Prediction Video Diffusion Model Danush Kumar Venkatesh Adam Schmidt Muhammad Abdullah Jamal Omid Mohareri VGen MedIm 142 0 0 07 Oct 2025
Token Merging via Spatiotemporal Information Mining for Surgical Video Understanding Xixi Jiang Chen Yang Dong Zhang Pingcheng Dong Xin Yang Kwang-Ting Cheng 108 0 0 28 Sep 2025
Decoding the Surgical Scene: A Scoping Review of Scene Graphs in Surgery Angelo Henriques Korab Hoxha Daniel Zapp Peter Charbel Issa Nassir Navab M. A. Nasseri 97 0 0 25 Sep 2025
Surgical Video Understanding with Label Interpolation Garam Kim Tae Kyeong Jeong Juyoun Park 84 0 0 23 Sep 2025
Multi-scale Temporal Prediction via Incremental Generation and Multi-agent Collaboration Zhitao Zeng Guojian Yuan Junyuan Mao Yuxuan Wang Xiaoshuang Jia Yueming Jin 252 0 0 22 Sep 2025
The SAGES Critical View of Safety Challenge: A Global Benchmark for AI-Assisted Surgical Quality Assessment Deepak Alapatt J. Eckhoff Zhiliang Lyu Yutong Ban J. Mazellier ... Pietro Mascagni Daniel A. Hashimoto Guy Rosman O. Meireles N. Padoy ELM 120 0 0 21 Sep 2025
EyePCR: A Comprehensive Benchmark for Fine-Grained Perception, Knowledge Comprehension and Clinical Reasoning in Ophthalmic Surgery Gui Wang Yang Wennuo Xusen Ma Zehao Zhong Zhuoru Wu Ende Wu Rong Qu W. Cheah Jianfeng Ren Linlin Shen 167 0 0 19 Sep 2025
Leveraging Generic Foundation Models for Multimodal Surgical Data Analysis Simon Pezold Jérôme A. Kurylec Jan S. Liechti Beat P. Müller Joël L. Lavanchy 78 0 0 08 Sep 2025
SurgLLM: A Versatile Large Multimodal Model with Spatial Focus and Temporal Awareness for Surgical Video Understanding Zhen Chen Xingjian Luo Kun Yuan J. Wu Danny Tat Ming Chan Nassir Navab Hongbin Liu Zhen Lei Jiebo Luo 192 2 0 30 Aug 2025
GLENDA: Gynecologic Laparoscopy Endometriosis DatasetConference on Multimedia Modeling (MMM), 2019 Andreas Leibetseder Sabrina Kletz Klaus Schoeffmann Simon Keckstein Jörg Keckstein 68 31 0 29 Aug 2025
Identifying Surgical Instruments in Laparoscopy Using Deep Learning Instance SegmentationInternational Conference on Content-Based Multimedia Indexing (CBMI), 2019 Sabrina Kletz Klaus Schoeffmann Jenny Benois-Pineau Heinrich Husslein 52 39 0 29 Aug 2025
ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments Zhe Han Charlie Budd Gongyu Zhang Huanyu Tian Christos Bergeles Tom Vercauteren 114 1 0 27 Aug 2025
OctreeNCA: Single-Pass 184 MP Segmentation on Consumer Hardware Nick Lemke John Kalkhof Niklas Babendererde Anirban Mukhopadhyay 80 0 0 09 Aug 2025
Object Recognition Datasets and Challenges: A Review Aria Salari Abtin Djavadifar Xiangrui Liu Homayoun Najjaran ObjD 182 69 0 30 Jul 2025
StepAL: Step-aware Active Learning for Cataract Surgical VideosInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025 Nisarg A. Shah Bardia Safaei S. Sikder S. Vedula Vishal M. Patel 138 1 0 29 Jul 2025
Datasets and Recipes for Video Temporal Grounding via Reinforcement Learning Ruizhe Chen Zhiting Fan Tianze Luo Heqing Zou Zhaopeng Feng Guiyang Xie Hansheng Zhang Zhuochen Wang Zuozhu Liu Huaijian Zhang AI4TS 155 7 0 24 Jul 2025
CPKD: Clinical Prior Knowledge-Constrained Diffusion Models for Surgical Phase Recognition in Endoscopic Submucosal Dissection Xiangning Zhang Jinnan Chen Qingwei Zhang Yaqi Wang Shilun Cai XiaoBo Li Dahong Qian MedIm 196 0 0 04 Jul 2025
SurgiSR4K: A High-Resolution Endoscopic Video Dataset for Robotic-Assisted Minimally Invasive Procedures Fengyi Jiang Xiaorui Zhang Lingbo Jin Ruixing Liang Yuxin Chen ... Wenqing Sun Cong Gao Hallie McNamara Jingpei Lu Omid Mohareri 144 0 0 30 Jun 2025
SurgVidLM: Towards Multi-grained Surgical Video Understanding with Large Language Model Guankun Wang Junyi Wang Wenjin Mo Long Bai Kun Yuan ... N. Padoy Zhen Lei Hongbin Liu Nassir Navab Hongliang Ren 193 2 0 22 Jun 2025
orGAN: A Synthetic Data Augmentation Pipeline for Simultaneous Generation of Surgical Images and Ground Truth Labels Niran Nataraj Maina Sogabe Kenji Kawashima MedIm 173 0 0 17 Jun 2025
SurgBench: A Unified Large-Scale Benchmark for Surgical Video Analysis Jianhui Wei Zikai Xiao Danyu Sun Luqi Gong Zongxin Yang Zuozhu Liu Jian Wu 173 3 0 09 Jun 2025
Challenging Vision-Language Models with Surgical Data: A New Dataset and Broad Benchmarking Study Leon D. Mayer Tim Radsch Dominik Michael Lucas Luttner Amine Yamlahi ... Patrick Godau Marcel Knopp Annika Reinke Fiona Kolbinger Lena Maier-Hein 247 0 0 06 Jun 2025
FORLA: Federated Object-centric Representation Learning with Slot Attention Guiqiu Liao M. Jogan Eric Eaton Daniel A. Hashimoto FedML 253 1 0 03 Jun 2025
Large-scale Self-supervised Video Foundation Model for Intelligent Surgery Shu Yang F. Zhou Leon D. Mayer Fuxiang Huang Yiliang Chen ... Zheng Li Jing Qin J. Teoh Lena Maier-Hein Hao-tao Chen 243 3 0 03 Jun 2025
SurgVLM: A Large Vision-Language Model and Systematic Evaluation Benchmark for Surgical Intelligence Zhitao Zeng Zhu Zhuo Xiaojun Jia Erli Zhang Junde Wu ... Xiaochun Cao Yutong Ban Qi Dou Yang Liu Yueming Jin VLM 402 8 0 03 Jun 2025
SG2VID: Scene Graphs Enable Fine-Grained Control for Video SynthesisInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025 Ssharvien Kumar Sivakumar Yannik Frisch Ghazal Ghazaei Anirban Mukhopadhyay VGen 283 1 0 03 Jun 2025
SemiVT-Surge: Semi-Supervised Video Transformer for Surgical Phase RecognitionInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025 Yiping Li Ronald L.P.D. de Jong Sahar Nasirihaghighi Tim J. M. Jaspers Romy van Jaarsveld ... Richard van Hillegersberg Fons van der Sommen J P Ruurda M. Breeuwer Yasmina al Khalil MedIm 204 3 0 02 Jun 2025
ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection Yiliang Chen Zhixi Li Cheng Xu Alex Qinyang Liu Ruize Cui Xuemiao Xu J. Teoh Shengfeng He Jing Qin 263 0 0 01 Jun 2025
EgoExOR: An Ego-Exo-Centric Operating Room Dataset for Surgical Activity Understanding Ege Özsoy Arda Mamur Felix Tristram Chantal Pellegrini Magdalena Wysocki Benjamin Busam Nassir Navab 127 4 0 30 May 2025
Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease ClassificationConference on Algebraic Informatics (AI), 2024 Xinliu Zhong Leo Hwa Liang Angela S. Koh Yeo Si Yong 265 1 0 30 May 2025
EndoBench: A Comprehensive Evaluation of Multi-Modal Large Language Models for Endoscopy Analysis Shengyuan Liu Boyun Zheng Wenting Chen Zhihao Peng Zhenfei Yin Jing Shao Jiancong Hu Yixuan Yuan ELM 334 9 0 29 May 2025
ReSW-VL: Representation Learning for Surgical Workflow Analysis Using Vision-Language Model Satoshi Kondo 166 0 0 19 May 2025
Specialized Foundation Models for Intelligent Operating Rooms Ege Özsoy Chantal Pellegrini David Bani-Harouni Kun Yuan Matthias Keicher Nassir Navab 247 0 0 19 May 2025
Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance Lianhao Yin O. Meireles Guy Rosman Daniela Rus 193 0 0 16 May 2025
You Are Your Best Teacher: Semi-Supervised Surgical Point Tracking with Cycle-Consistent Self-Distillation Valay Bundele Mehran Hosseinzadeh Hendrik Lensch 266 0 0 09 May 2025
Sim2Real in endoscopy segmentation with a novel structure aware image translation Clara Tomasini L. Riazuelo Ana C. Murillo MedIm 216 0 0 05 May 2025
Multimodal Graph Representation Learning for Robust Surgical Workflow Recognition with Adversarial Feature DisentanglementInformation Fusion (Inf. Fusion), 2025 Long Bai Boyi Ma Ruohan Wang Guankun Wang Beilei Cui ... Mobarakol Islam Zhe Min Jiewen Lai Nassir Navab Hongliang Ren 290 2 0 03 May 2025
Surgeons vs. Computer Vision: A comparative analysis on surgical phase recognition capabilitiesInternational Journal of Computer Assisted Radiology and Surgery (IJCARS), 2025 Marco Mezzina Pieter De Backer Tom Vercauteren Matthew B. Blaschko Alexandre Mottrie Tinne Tuytelaars 136 1 0 26 Apr 2025
Multi-Stage Boundary-Aware Transformer Network for Action Segmentation in Untrimmed Surgical VideosComputer Vision and Image Understanding (CVIU), 2025 Rezowan Shuvo M S Mekala Eyad Elyan MedIm 883 1 0 26 Apr 2025
Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections Max Kirchner Alexander C. Jenke S. Bodenstedt Fiona Kolbinger Oliver Saldanha Jakob N. Kather M. Wagner Stefanie Speidel FedML MedIm 365 4 0 23 Apr 2025
Temporal Propagation of Asymmetric Feature Pyramid for Surgical Scene Segmentation Cheng Yuan Yutong Ban MedIm 238 1 0 18 Apr 2025