Empirical Bernstein Bounds and Sample Variance Penalization

Annual Conference Computational Learning Theory (COLT), 2009

21 July 2009

Andreas Maurer

Massimiliano Pontil

ArXiv (abs)PDF HTML

Papers citing "Empirical Bernstein Bounds and Sample Variance Penalization"

50 / 335 papers shown

Vector-valued self-normalized concentration inequalities beyond sub-Gaussianity

Diego Martinez-Taboada

Tomás González

Aaditya Ramdas

121

05 Nov 2025

Continuum: Efficient and Robust Multi-Turn LLM Agent Scheduling with KV Cache Time-to-Live

477

04 Nov 2025

Towards Scalable Oversight via Partitioned Human Supervision

Ren Yin

Takashi Ishida

Masashi Sugiyama

207

26 Oct 2025

Fair Representation Learning with Controllable High Confidence Guarantees via Adversarial Inference

Przemyslaw A. Grabowicz

FaML

327

23 Oct 2025

Learning Upper Lower Value Envelopes to Shape Online RL: A Principled Approach

167

22 Oct 2025

Fast Best-in-Class Regret for Contextual Bandits

Samuel Girard

Aurélien Bibaut

Houssam Zenati

Nathan Kallus

Houssam Zenati

OffRL

166

17 Oct 2025

Risk-Aware Reinforcement Learning with Bandit-Based Adaptation for Quadrupedal Locomotion

Yuanhong Zeng

Anushri Dixit

OffRL

130

16 Oct 2025

SGM: A Statistical Godel Machine for Risk-Controlled Recursive Self-Modification

161

11 Oct 2025

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Alakh Sharma

Gaurish Trivedi

Kartikey Singh Bhandari

142

27 Sep 2025

Hybrid Safety Verification of Multi-Agent Systems using

ψ

-Weighted CBFs and PAC Guarantees

Venkat Margapuri

Garik Kazanjian

Naren Kosaraju

173

24 Sep 2025

Sample Efficient Certification of Discrete-Time Control Barrier Functions

Sampath Kumar Mulagaleti

Andrea Del Prete

104

04 Sep 2025

ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning

440

05 Aug 2025

Sample-Efficient Distributionally Robust Multi-Agent Reinforcement Learning via Online Interaction

Zain Ulabedeen Farhat

Debamita Ghosh

George Atia

Yue Wang

233

04 Aug 2025

How Much Is Too Much? Adaptive, Context-Aware Risk Detection in Naturalistic Driving

Amir Hossein Kalantari

Eleonora Papadimitriou

Arkady Zgonnikov

Amir Pooyan Afghari

328

26 Jul 2025

Nearly Minimax Discrete Distribution Estimation in Kullback-Leibler Divergence with High Probability

Dirk van der Hoeven

Julia Olkhovskaia

T. Erven

196

23 Jul 2025

The Sample Complexity of Parameter-Free Stochastic Convex Optimization

263

12 Jun 2025

Performative Risk Control: Calibrating Models for Reliable Deployment under Performativity

246

30 May 2025

STaR-Bets: Sequential Target-Recalculating Bets for Tighter Confidence Intervals

Václav Voráček

Francesco Orabona

289

28 May 2025

Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees

Sangwoo Park

Matteo Zecchin

Osvaldo Simeone

386

24 May 2025

Rethink Repeatable Measures of Robot Performance with Statistical Query

Bowen Weng

L. Capito

Guillermo A. Castillo

Dylan Khor

495

13 May 2025

Lower Bounds on the MMSE of Adversarially Inferring Sensitive Features

431

13 May 2025

Online Episodic Convex Reinforcement Learning

356

12 May 2025

Compute-Optimal LLMs Provably Generalize Better With ScaleInternational Conference on Learning Representations (ICLR), 2025

498

21 Apr 2025

Ensuring Safety in an Uncertain Environment: Constrained MDPs via Stochastic Thresholds

Qian Zuo

Fengxiang He

384

07 Apr 2025

Bridging the Theoretical Gap in Randomized SmoothingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

479

03 Apr 2025

Estimating stationary mass, frequency by frequencyAnnual Conference Computational Learning Theory (COLT), 2025

Milind Nakul

Vidya Muthukumar

A. Pananjady

682

17 Mar 2025

Seldonian Reinforcement Learning for Ad Hoc Teamwork

Edoardo Zorzi

A. Castellini

Leonidas Bakopoulos

Georgios Chalkiadakis

Alessandro Farinelli

OffRL

357

05 Mar 2025

A Refined Analysis of UCBVI

Simone Drago

Marco Mussi

Alberto Maria Metelli

415

24 Feb 2025

On Agnostic PAC Learning in the Small Error Regime

Julian Asilis

Mikael Møller Høgsgaard

Grigoris Velegkas

308

13 Feb 2025

Near-Optimal Reinforcement Learning with Shuffle Differential Privacy

Shaojie Bai

Mohammad Sadegh Talebi

518

18 Nov 2024

Towards Harmless Rawlsian Fairness Regardless of Demographic PriorNeural Information Processing Systems (NeurIPS), 2024

440

04 Nov 2024

Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous AgentsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

322

30 Oct 2024

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

A. S. Rawat

Veeranjaneyulu Sadhanala

...

Sanjiv Kumar

552

24 Oct 2024

Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive ApproachNeural Information Processing Systems (NeurIPS), 2024

Riccardo Poiani

Nicole Nobili

Alberto Maria Metelli

Marcello Restelli

190

17 Oct 2024

Linguistically Grounded Analysis of Language Models using Shapley Head ValuesNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

Marcell Richard Fekete

Johannes Bjerva

524

17 Oct 2024

Instrumental variables: A non-asymptotic viewpoint

Eric Xia

Martin J. Wainwright

Whitney Newey

206

02 Oct 2024

Empirical Bernstein in smooth Banach spaces

Diego Martinez-Taboada

Aaditya Ramdas

355

09 Sep 2024

Randomization Techniques to Mitigate the Risk of Copyright Infringement

Wei-Ning Chen

265

21 Aug 2024

Efficient Reinforcement Learning in Probabilistic Reward MachinesAAAI Conference on Artificial Intelligence (AAAI), 2024

Xiaofeng Lin

Xuezhou Zhang

312

19 Aug 2024

Making Robust Generalizers Less Rigid with Loss Concentration

Matthew J. Holland

Toma Hamada

OOD

437

07 Aug 2024

Early Stopping Based on Repeated SignificanceBigData Congress [Services Society] (BSS), 2024

Eric Bax

Arundhyoti Sarkar

Alex Shtoff

255

01 Aug 2024

How to Shrink Confidence Sets for Many Equivalent Discrete Distributions?

Odalric-Ambrym Maillard

M. S. Talebi

178

22 Jul 2024

Semi-Variance Reduction for Fair Federated Learning

Saber Malekmohammadi

Yaoliang Yu

FedML

467

23 Jun 2024

A Provably Efficient Option-Based Algorithm for both High-Level and Low-Level Learning

Gianluca Drappo

Alberto Maria Metelli

Marcello Restelli

143

21 Jun 2024

A Multi-Armed Bandit Approach to Online Selection and Evaluation of Generative Models

Xiaoyan Hu

Ho-fung Leung

Farzan Farnia

321

11 Jun 2024

Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and LearningNeural Information Processing Systems (NeurIPS), 2024

364

23 May 2024

DirMixE: Harnessing Test Agnostic Long-tail Recognition with Hierarchical Label VartiationsInternational Conference on Machine Learning (ICML), 2024

268

13 May 2024

Optimistic Regret Bounds for Online Learning in Adversarial Markov Decision ProcessesConference on Uncertainty in Artificial Intelligence (UAI), 2024

Sang Bin Moon

Abolfazl Hashemi

252

03 May 2024

Multi-Objective Recommendation via Multivariate Policy LearningACM Conference on Recommender Systems (RecSys), 2024

283

03 May 2024

An Information Theoretic Perspective on Conformal PredictionNeural Information Processing Systems (NeurIPS), 2024

519

03 May 2024