HÁ 1 DIA
14MIN

Thompson Sampling Regret Bounds for Logistic Bandits

Dive into the mathematics of decision-making under uncertainty, exploring how Thompson Sampling helps balance exploration and exploitation in online learning with binary outcomes.

Página do episódio

Podcast

Neural intel Pod
Frequência

Diário
Publicado

8 de janeiro de 2025 02:24 UTC
Duração

14min
Classificação

Livre

Thompson Sampling Regret Bounds for Logistic Bandits

Informações