v1v2v3v4 (latest)

Faster and Better LLMs via Latency-Aware Test-Time Scaling

26 May 2025

Papers citing "Faster and Better LLMs via Latency-Aware Test-Time Scaling"

7 / 7 papers shown

$TPS-Bench: Evaluating AI Agents' Tool Planning \& Scheduling Abilities in Compounding Tasks$

TPS-Bench: Evaluating AI Agents' Tool Planning \& Scheduling Abilities in Compounding Tasks

135

03 Nov 2025

Heimdall: test-time scaling on the generative verification

Wenlei Shi

Xing Jin

LRM

423

14 Apr 2025

Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models

428

07 Apr 2025

EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test

601

03 Mar 2025

Towards Thinking-Optimal Scaling of Test-Time Compute for LLM Reasoning

496

25 Feb 2025

Large Language Monkeys: Scaling Inference Compute with Repeated Sampling

943

571

03 Jan 2025

EAGLE: Speculative Sampling Requires Rethinking Feature UncertaintyInternational Conference on Machine Learning (ICML), 2024

590

319

26 Jan 2024