BranchyNet: Fast Inference via Early Exiting from Deep Neural Networks

6 September 2017

Surat Teerapittayanon

Papers citing "BranchyNet: Fast Inference via Early Exiting from Deep Neural Networks"

50 / 125 papers shown

Title
DPNet: Dynamic Pooling Network for Tiny Object Detection Luqi Gong Haotian Chen Y. Chen Tianliang Yao Chao Li Shuai Zhao Guangjie Han ObjD 134 0 0 05 May 2025
Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques Sanjay Surendranath Girija Shashank Kapoor Lakshit Arora Dipen Pradhan Aman Raj Ankit Shetgaonkar 52 0 0 05 May 2025
DYNAMAX: Dynamic computing for Transformers and Mamba based architectures Miguel Nogales Matteo Gambella Manuel Roveri 56 0 0 29 Apr 2025
Bi-directional Model Cascading with Proxy Confidence David Warren Mark Dras 44 0 0 27 Apr 2025
EPSILON: Adaptive Fault Mitigation in Approximate Deep Neural Network using Statistical Signatures Khurram Khalil K. A. Hoque AAML 81 0 0 24 Apr 2025
DyDiT++: Dynamic Diffusion Transformers for Efficient Visual Generation Wangbo Zhao Yizeng Han Jiasheng Tang Kai Wang Hao Luo Yibing Song Gao Huang Fan Wang Yang You 69 0 0 09 Apr 2025
Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning Jiuyang Dong Junjun Jiang Kui Jiang Jiahan Li Yongbing Zhang 40 0 0 28 Feb 2025
The Representation and Recall of Interwoven Structured Knowledge in LLMs: A Geometric and Layered Analysis Ge Lei Samuel J. Cooper KELM 47 0 0 15 Feb 2025
BEEM: Boosting Performance of Early Exit DNNs using Multi-Exit Classifiers as Experts Divya J. Bajpai M. Hanawal 65 0 0 02 Feb 2025
DCentNet: Decentralized Multistage Biomedical Signal Classification using Early Exits Xiaolin Li Binhua Huang B. Cardiff Deepu John 41 0 0 31 Jan 2025
MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation Chenxi Wang Xiang Chen N. Zhang Bozhong Tian Haoming Xu Shumin Deng H. Chen MLLM LRM 29 4 0 15 Oct 2024
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks Yijiong Yu Ma Xiufa Fang Jianwei Zhi-liang Xu Su Guangyao ... Zhixiao Qi Wei Wang W. Liu Ran Chen Ji Pei LRM RALM 27 0 0 06 Oct 2024
SOI: Scaling Down Computational Complexity by Estimating Partial States of the Model Grzegorz Stefański P. Daniluk Artur Szumaczuk Jakub Tkaczuk 26 0 0 04 Oct 2024
Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models Xin Zou Yizhou Wang Yibo Yan Yuanhuiyi Lyu Kening Zheng ... Junkai Chen Peijie Jiang J. Liu Chang Tang Xuming Hu 86 7 0 04 Oct 2024
Network Fission Ensembles for Low-Cost Self-Ensembles Hojung Lee Jong-Seok Lee UQCV 52 0 0 05 Aug 2024
Accelerating Large Language Model Inference with Self-Supervised Early Exits Florian Valade LRM 36 1 0 30 Jul 2024
Learning Motion Blur Robust Vision Transformers with Dynamic Early Exit for Real-Time UAV Tracking You Wu Xucheng Wang Dan Zeng Hengzhou Ye Xiaolan Xie Qijun Zhao Shuiwang Li 35 3 0 07 Jul 2024
Model Adaptation for Time Constrained Embodied Control Jaehyun Song Minjong Yoo Honguk Woo 37 0 0 17 Jun 2024
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs Wei Zhong Manasa Bharadwaj 37 5 0 30 May 2024
Towards Energy-Aware Federated Learning via MARL: A Dual-Selection Approach for Model and Client Jun Xia Yi Zhang Yiyu Shi 29 0 0 13 May 2024
Tiny Models are the Computational Saver for Large Models Qingyuan Wang B. Cardiff Antoine Frappé Benoît Larras Deepu John 29 2 0 26 Mar 2024
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Emad Fallahzadeh Bram Adams Ahmed E. Hassan MQ 32 3 0 25 Mar 2024
Cooperative Learning for Cost-Adaptive Inference Xingli Fang Richard M. Bradford Jung-Eun Kim 26 1 0 13 Dec 2023
EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism Yanxi Chen Xuchen Pan Yaliang Li Bolin Ding Jingren Zhou LRM 33 31 0 08 Dec 2023
Adaptive Early Exiting for Collaborative Inference over Noisy Wireless Channels Mikolaj Jankowski Deniz Gunduz K. Mikolajczyk 19 3 0 29 Nov 2023
PAUMER: Patch Pausing Transformer for Semantic Segmentation Evann Courdier Prabhu Teja Sivaprasad F. Fleuret 31 2 0 01 Nov 2023
Mobile Foundation Model as Firmware Jinliang Yuan Chenchen Yang Dongqi Cai Shihe Wang Xin Yuan ... Di Zhang Hanzi Mei Xianqing Jia Shangguang Wang Mengwei Xu 34 19 0 28 Aug 2023
Using Early Exits for Fast Inference in Automatic Modulation Classification E. Mohammed Omar Mashaal H. Abou-zeid 14 3 0 22 Aug 2023
F-PABEE: Flexible-patience-based Early Exiting for Single-label and Multi-label text Classification Tasks Xiangxiang Gao Wei-wei Zhu Jiasheng Gao Congrui Yin VLM 23 12 0 21 May 2023
Towards Carbon-Neutral Edge Computing: Greening Edge AI by Harnessing Spot and Future Carbon Markets Huirong Ma Zhi Zhou Xiaoxi Zhang Xu Chen 13 11 0 22 Apr 2023
DynamicDet: A Unified Dynamic Architecture for Object Detection Zhi-Hao Lin Yongtao Wang Jinhe Zhang Xiaojie Chu ObjD 23 30 0 12 Apr 2023
Revisiting Single-gated Mixtures of Experts Amelie Royer I. Karmanov Andrii Skliar B. Bejnordi Tijmen Blankevoort MoE MoMe 31 6 0 11 Apr 2023
Memorization Capacity of Neural Networks with Conditional Computation Erdem Koyuncu 30 4 0 20 Mar 2023
Adaptive Rotated Convolution for Rotated Object Detection Yifan Pu Yiru Wang Zhuofan Xia Yizeng Han Yulin Wang Weihao Gan Zidong Wang S. Song Gao Huang 17 76 0 14 Mar 2023
Map-and-Conquer: Energy-Efficient Mapping of Dynamic Neural Nets onto Heterogeneous MPSoCs Halima Bouzidi Mohanad Odema Hamza Ouarnoughi Smail Niar Mohammad Abdullah Al Faruque 21 8 0 24 Feb 2023
Fixing Overconfidence in Dynamic Neural Networks Lassi Meronen Martin Trapp Andrea Pilzer Le Yang Arno Solin BDL 28 16 0 13 Feb 2023
Towards Inference Efficient Deep Ensemble Learning Ziyue Li Kan Ren Yifan Yang Xinyang Jiang Yuqing Yang Dongsheng Li BDL 21 12 0 29 Jan 2023
Anticipate, Ensemble and Prune: Improving Convolutional Neural Networks via Aggregated Early Exits Simone Sarti Eugenio Lomurno Matteo Matteucci 19 4 0 28 Jan 2023
Adaptive Deep Neural Network Inference Optimization with EENet Fatih Ilhan Ka-Ho Chow Sihao Hu Tiansheng Huang Selim Tekin ... Myungjin Lee Ramana Rao Kompella Hugo Latapie Gan Liu Ling Liu 26 11 0 15 Jan 2023
AdaEnsemble: Learning Adaptively Sparse Structured Ensemble Network for Click-Through Rate Prediction Yachen Yan Liubo Li 14 3 0 06 Jan 2023
Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via Deep Reinforcement Learning Wen Wu Peng Yang Weiting Zhang Conghao Zhou Xuemin X. Shen 24 103 0 31 Dec 2022
SplitGP: Achieving Both Generalization and Personalization in Federated Learning Dong-Jun Han Do-Yeon Kim Minseok Choi Christopher G. Brinton Jaekyun Moon FedML 18 31 0 16 Dec 2022
Vision Transformer Computation and Resilience for Dynamic Inference Kavya Sreedhar Jason Clemons Rangharajan Venkatesan S. Keckler M. Horowitz 24 2 0 06 Dec 2022
Boosted Dynamic Neural Networks Haichao Yu Haoxiang Li G. Hua Gao Huang Humphrey Shi 30 7 0 30 Nov 2022
Layer-Stack Temperature Scaling Amr Khalifa Michael C. Mozer Hanie Sedghi Behnam Neyshabur Ibrahim M. Alabdulmohsin 75 2 0 18 Nov 2022
Enabling AI Quality Control via Feature Hierarchical Edge Inference Jinhyuk Choi Seongun Kim Seung-Woo Ko 10 0 0 15 Nov 2022
Avoid Overthinking in Self-Supervised Models for Speech Recognition Dan Berrebbi Brian Yan Shinji Watanabe LRM 13 4 0 01 Nov 2022
Class Based Thresholding in Early Exit Semantic Segmentation Networks Alperen Görmez Erdem Koyuncu 23 5 0 27 Oct 2022
COST-EFF: Collaborative Optimization of Spatial and Temporal Efficiency with Slenderized Multi-exit Language Models Bowen Shen Zheng Lin Yuanxin Liu Zhengxiao Liu Lei Wang Weiping Wang VLM 33 4 0 27 Oct 2022
Efficiently Controlling Multiple Risks with Pareto Testing Bracha Laufer-Goldshtein Adam Fisch Regina Barzilay Tommi Jaakkola 34 16 0 14 Oct 2022