The Cascade Transformer: an Application for Efficient Answer Sentence
Selection

The Cascade Transformer: an Application for Efficient Answer Sentence Selection

5 May 2020

Luca Soldaini

Alessandro Moschitti

Papers citing "The Cascade Transformer: an Application for Efficient Answer Sentence Selection"

11 / 11 papers shown

Title
ORXE: Orchestrating Experts for Dynamically Configurable Efficiency Qingyuan Wang Guoxin Wang B. Cardiff Deepu John 38 0 0 07 May 2025
Mobile Edge Intelligence for Large Language Models: A Contemporary Survey Guanqiao Qu Qiyuan Chen Wei Wei Zheng Lin Xianhao Chen Kaibin Huang 42 43 0 09 Jul 2024
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Emad Fallahzadeh Bram Adams Ahmed E. Hassan MQ 32 3 0 25 Mar 2024
Certified Error Control of Candidate Set Pruning for Two-Stage Relevance Ranking Minghan Li Xinyu Crystina Zhang Ji Xin Hongyang R. Zhang Jimmy J. Lin 38 6 0 19 May 2022
ED2LM: Encoder-Decoder to Language Model for Faster Document Re-ranking Inference Kai Hui Honglei Zhuang Tao Chen Zhen Qin Jing Lu ... Ji Ma Jai Gupta Cicero Nogueira dos Santos Yi Tay Donald Metzler 34 16 0 25 Apr 2022
Ensemble Transformer for Efficient and Accurate Ranking Tasks: an Application to Question Answering Systems Yoshitomo Matsubara Luca Soldaini Eric Lind Alessandro Moschitti 21 6 0 15 Jan 2022
Split Computing and Early Exiting for Deep Learning Applications: Survey and Research Challenges Yoshitomo Matsubara Marco Levorato Francesco Restuccia 22 199 0 08 Mar 2021
CascadeBERT: Accelerating Inference of Pre-trained Language Models via Calibrated Complete Models Cascade Lei Li Yankai Lin Deli Chen Shuhuai Ren Peng Li Jie Zhou Xu Sun 26 51 0 29 Dec 2020
Pretrained Transformers for Text Ranking: BERT and Beyond Jimmy J. Lin Rodrigo Nogueira Andrew Yates VLM 219 610 0 13 Oct 2020
A Study on Efficiency, Accuracy and Document Structure for Answer Sentence Selection Daniele Bonadiman Alessandro Moschitti RALM 16 10 0 04 Mar 2020
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism M. Shoeybi M. Patwary Raul Puri P. LeGresley Jared Casper Bryan Catanzaro MoE 245 1,817 0 17 Sep 2019