Thompson Sampling Regret Bounds for Logistic Bandits

Neural intel Pod

Dive into the mathematics of decision-making under uncertainty, exploring how Thompson Sampling helps balance exploration and exploitation in online learning with binary outcomes.

Para ouvir episódios explícitos, inicie sessão.

Fique por dentro deste podcast

Inicie sessão ou crie uma conta para seguir podcasts, salvar episódios e receber as atualizações mais recentes.

Selecionar um país ou região

África, Oriente Médio e Índia

Ásia‑Pacífico

Europa

América Latina e Caribe

Estados Unidos e Canadá