Mixture of Experts

MoE

Mixture of Experts (MoE) is a machine learning technique that uses multiple expert models to make predictions. Each expert specializes in different aspects of the data, and a gating network determines which expert to use for a given input. This approach can improve model performance and efficiency.

Neighbor communities

51015

Featured Papers

0 / 0 papers shown

Title

All papers

50 / 1,506 papers shown

Title
Opportunistic Expert Activation: Batch-Aware Expert Routing for Faster Decode Without Retraining Costin-Andrei Oncescu Qingyang Wu Wai Tong Chung Robert Wu Bryan Gopal Junxiong Wang Tri Dao Ben Athiwaratkun MoE 16 0 0 04 Nov 2025
CryptoMoE: Privacy-Preserving and Scalable Mixture of Experts Inference via Balanced Expert Routing Yifan Zhou Tianshi Xu Jue Hong Ye Wu Meng Li MoE 68 0 0 03 Nov 2025
DEER: Disentangled Mixture of Experts with Instance-Adaptive Routing for Generalizable Machine-Generated Text Detection Guoxin Ma Xiaoming Liu Zhanhan Zhang Chengzhengxu Li Shengchao Liu Yu Lan MoE 4 0 0 03 Nov 2025
Random Initialization of Gated Sparse Adapters Vi Retault Yohaï-Eliel Berreby CLL MoE 20 0 0 03 Nov 2025
ExpertFlow: Adaptive Expert Scheduling and Memory Coordination for Efficient MoE Inference Zixu Shen Kexin Chu Y. Zhang Dawei Xiang R. Wu Wei Zhang MoE 24 0 0 30 Oct 2025
Mixture-of-Transformers Learn Faster: A Theoretical Study on Classification Problems Hongbo Li Qinhang Wu Sen Lin Yingbin Liang Ness B. Shroff MoE 4 0 0 30 Oct 2025
MoME: Mixture of Visual Language Medical Experts for Medical Imaging Segmentation Arghavan Rezvani Xiangyi Yan Anthony T. Wu Kun Han Pooya Khosravi Xiaohui Xie MoE 28 0 0 30 Oct 2025
MossNet: Mixture of State-Space Experts is a Multi-Head Attention Shikhar Tuli James Smith Haris Jeelani Chi-Heng Lin Abhishek Patel Vasili Ramanishka Yen-Chang Hsu Hongxia Jin MoE 51 0 0 30 Oct 2025
Mixture-of-Experts Operator Transformer for Large-Scale PDE Pre-Training Hong Wang Haiyang Xin Jie Wang Xuanze Yang Fei Zha Huanshuo Dong Yan Jiang MoE AI4CE 171 0 0 29 Oct 2025
Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation Inclusion AI Bowen Ma Cheng Zou C. Yan Chunxiang Jin ... Zhiqiang Fang Zhihao Qiu Ziyuan Huang Zizheng Yang Z. He MLLM MoE VLM 105 0 0 28 Oct 2025
Routing Matters in MoE: Scaling Diffusion Transformers with Explicit Routing Guidance Y. X. Wei Shiwei Zhang Hangjie Yuan Yujin Han Zhekai Chen ... Difan Zou Xihui Liu Yingya Zhang Yu Liu Hongming Shan DiffM MoE 22 0 0 28 Oct 2025
EMTSF:Extraordinary Mixture of SOTA Models for Time Series Forecasting Musleh Alharthi Kaleel Mahmood Sarosh Patel A. Mahmood AI4TS MoE 101 0 0 27 Oct 2025
Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts Di Zhang Xun Wu Shaohan Huang Y. Hao Li Dong Zewen Chi Lei Sha Furu Wei MoE 32 0 0 27 Oct 2025
Sparsity and Superposition in Mixture of Experts Marmik Chaudhari Jeremi Nuer Rome Thorstenson MoE 60 0 0 26 Oct 2025
Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation Ling Team Ang Li B. Liu Binbin Hu Bing Li ... Siyuan Li Song Liu Ting Guo Tong Zhao Wanli Gu MoE ReLM ALM LRM AI4CE ELM 56 0 0 25 Oct 2025
Metis-HOME: Hybrid Optimized Mixture-of-Experts for Multimodal Reasoning Xiaohan Lan Fanfan Liu Haibo Qiu Siqi Yang Delian Ruan Peng Shi Lin Ma MoE LRM 24 0 0 23 Oct 2025
A Parameter-Efficient Mixture-of-Experts Framework for Cross-Modal Geo-Localization Linfeng Li Jian-jun Zhao Zepeng Yang Yuhang Song Bojun Lin Tianle Zhang Yuchen Yuan C. Zhang Xuelong Li MoE 52 0 0 23 Oct 2025
HybridEP: Scaling Expert Parallelism to Cross-Datacenter Scenario via Hybrid Expert/Data Transmission Weihao Yang Hao Huang Donglei Wu Ningke Li Yanqi Pan Qiyang Zheng Wen Xia Shiyi Li Qiang Wang MoE 36 0 0 22 Oct 2025
MoE-GS: Mixture of Experts for Dynamic Gaussian Splatting In-Hwan Jin Hyeongju Mun Joonsoo Kim Kugjin Yun Kyeongbo Kong 3DGS MoE 85 0 0 22 Oct 2025
ToMMeR -- Efficient Entity Mention Detection from Large Language Models Victor Morand Nadi Tomeh Josiane Mothe Benjamin Piwowarski MoE VLM 48 0 0 22 Oct 2025
MoE-Prism: Disentangling Monolithic Experts for Elastic MoE Services via Model-System Co-Designs Xinfeng Xia Jiacheng Liu Xiaofeng Hou Peng Tang Mingxuan Zhang Wenfeng Wang Chao Li MoE 36 0 0 22 Oct 2025
Noise-Conditioned Mixture-of-Experts Framework for Robust Speaker Verification Bin Gu Lipeng Dai Huipeng Du Haitao Zhao Jibo Wei AAML MoE 32 0 0 21 Oct 2025
ReXMoE: Reusing Experts with Minimal Overhead in Mixture-of-Experts Zheyue Tan Ruoyao Xiao Tao Yuan Dong Zhou Weilin Liu ... Haiyang Xu Boxun Li Guohao Dai Bo Zhao Yu Wang MoE 36 0 0 20 Oct 2025
Learned Inertial Odometry for Cycling Based on Mixture of Experts Algorithm Hao Qiao Yan Wang Shuo Yang Xiaoyao Yu Jian Kuang X. Niu MoE 28 0 0 20 Oct 2025
Intelligent Communication Mixture-of-Experts Boosted-Medical Image Segmentation Foundation Model Xinwei Zhang Hu Chen Zhe Yuan Sukun Tian Peng Feng MoE 31 0 0 20 Oct 2025
L-MoE: End-to-End Training of a Lightweight Mixture of Low-Rank Adaptation Experts Shihao Ji Zihui Song MoE 58 0 0 19 Oct 2025
Leave It to the Experts: Detecting Knowledge Distillation via MoE Expert Signatures Pingzhi Li Morris Yu-Chao Huang Zhen Tan Qingquan Song Jie Peng Kai Zou Yu Cheng Kaidi Xu Tianlong Chen MoE AAML 53 0 0 19 Oct 2025
Input Domain Aware MoE: Decoupling Routing Decisions from Task Optimization in Mixture of Experts Yongxiang Hua H. Cao Zhou Tao Bocheng Li Zihao Wu Chaohu Liu Linli Xu MoE 44 0 0 18 Oct 2025
Modeling Expert Interactions in Sparse Mixture of Experts via Graph Structures Minh Khoi Nguyen Nhat R. Teo Laziz U. Abdullaev Maurice Mok Viet-Hoang Tran T. Nguyen MoE 38 0 0 18 Oct 2025
Mixture of Experts Approaches in Dense Retrieval Tasks Effrosyni Sokli Pranav Kasela Georgios Peikos G. Pasi MoE 36 0 0 17 Oct 2025
MTmixAtt: Integrating Mixture-of-Experts with Multi-Mix Attention for Large-Scale Recommendation Xianyang Qi Hao Guo Zhaoyu Hu Zhirui Kuai Chang Liu Hongxiang Lin Lei Wang OffRL MoE 76 0 0 17 Oct 2025
Expertise need not monopolize: Action-Specialized Mixture of Experts for Vision-Language-Action Learning Weijie Shen Y. Liu Yuhao Wu Zhixuan Liang Sijia Gu ... Yusen Qin Jiangmiao Pang Xinping Guan Xiaokang Yang Yao Mu MoE 24 0 0 16 Oct 2025
Rewiring Experts on the Fly:Continuous Rerouting for Better Online Adaptation in Mixture-of-Expert models Guinan Su Yanwu Yang Li Shen Lu Yin Shiwei Liu Jonas Geiping MoE KELM 52 1 0 16 Oct 2025
MACE: Mixture-of-Experts Accelerated Coordinate Encoding for Large-Scale Scene Localization and Rendering Mingkai Liu Dikai Fan Haohua Que Haojia Gao Xiao Liu ... Ruicong Ye Wanli Qiu Handong Yao Ruopeng Zhang X. Y. Huang MoE 8 0 0 16 Oct 2025
GatePro: Parameter-Free Expert Selection Optimization for Mixture-of-Experts Models Chen Zheng Y. Cai Deyi Liu Jin Ma Yiyuan Ma Y. Yang Jing Liu Yutao Zeng Xun Zhou Siyuan Qiao MoE 48 0 0 15 Oct 2025
UniMoE-Audio: Unified Speech and Music Generation with Dynamic-Capacity MoE Zhenyu Liu Yunxin Li Xuanyu Zhang Qixun Teng Shenyuan Jiang ... Mingjun Zhao Yu-Syuan Xu Yancheng He Baotian Hu Min Zhang AuLLM MoE 74 0 0 15 Oct 2025
VaultGemma: A Differentially Private Gemma Model Amer Sinha Thomas Mesnard Ryan McKenna Daogao Liu Christopher A. Choquette-Choo ... Borja De Balle Pigem Prem Eruvbetine T. Warkentin Armand Joulin Ravi KumarAmer Sinha FedML MoE VLM MDE 126 1 0 15 Oct 2025
Steer-MoE: Efficient Audio-Language Alignment with a Mixture-of-Experts Steering Module Ruitao Feng Bixi Zhang Sheng Liang Zheng Yuan AuLLM MoE LLMSV 47 0 0 15 Oct 2025
Sparse Subnetwork Enhancement for Underrepresented Languages in Large Language Models Daniil Gurgurov Josef van Genabith Simon Ostermann MoE 52 0 0 15 Oct 2025
Toward Efficient Inference Attacks: Shadow Model Sharing via Mixture-of-Experts Li Bai Qingqing Ye Xinwei Zhang Sen Zhang Zi Liang Jianliang Xu Haibo Hu FedML MIACV MoE 65 0 0 15 Oct 2025
Who Speaks for the Trigger? Dynamic Expert Routing in Backdoored Mixture-of-Experts Transformers Xin Zhao Xiaojun Chen Bingshan Liu Haoyu Gao Zhendong Zhao Yilong Chen MoE AAML 52 0 0 15 Oct 2025
MoBiLE: Efficient Mixture-of-Experts Inference on Consumer GPU with Mixture of Big Little Experts Yushu Zhao Yubin Qin Yang Wang Xiaolong Yang Huiming Han Shaojun Wei Yang Hu Shouyi Yin MoE 35 0 0 14 Oct 2025
Scope: Selective Cross-modal Orchestration of Visual Perception Experts Tianyu Zhang Suyuchen Wang Chao Wang Juan A. Rodriguez Ahmed Masry Xiangru Jian Yoshua Bengio Perouz Taslakian MoE 78 0 0 14 Oct 2025
DND: Boosting Large Language Models with Dynamic Nested Depth Tieyuan Chen Xiaodong Chen Haoxing Chen Zhenzhong Lan W. Lin Jianguo Li MoE 48 0 0 13 Oct 2025
MC#: Mixture Compressor for Mixture-of-Experts Large Models Wei Huang Yue Liao Yukang Chen Jianhui Liu Haoru Tan Si Liu Shiming Zhang Shuicheng Yan Xiaojuan Qi MoE MQ 64 0 0 13 Oct 2025
MeTA-LoRA: Data-Efficient Multi-Task Fine-Tuning for Large Language Models Bo Cheng Xu Wang Jinda Liu Yi-Ju Chang Yuan Wu MoE ALM 48 0 0 13 Oct 2025
Stabilizing MoE Reinforcement Learning by Aligning Training and Inference Routers Wenhan Ma Hailin Zhang Liang Zhao Yifan Song Yudong Wang Zhifang Sui Fuli Luo MoE 17 0 0 13 Oct 2025
Hierarchical LoRA MoE for Efficient CTR Model Scaling Zhichen Zeng Mengyue Hang Xiaolong Liu Xiaoyi Liu Xiao Lin ... Chaofei Yang Yiqun Liu Hang Yin Jiyan Yang Hanghang Tong MoE 24 0 0 12 Oct 2025
Informed Routing in LLMs: Smarter Token-Level Computation for Faster Inference Chao Han Yijuan Liang Zihao Xuan Daokuan Wu Wei Zhang Xiaoyu Shen MoE 7 0 0 10 Oct 2025
Utilizing dynamic sparsity on pretrained DETR Reza Sedghi Anand Subramoney David Kappel MoE 24 0 0 10 Oct 2025

Loading #Papers per Month with "MoE"

Past speakers

Name (-)

Top Contributors

Name (-)

Top Organizations at ResearchTrend.AI

Name (-)

Social Events

Date	Location	Event
No social events available