Skip to main content

Learn
search
tags
Archives

Optimistic Initial Values

Overall Progress 0%

Using optimistic initial Q-values to encourage early exploration in multi-armed bandits.

Go to Bandits: Optimistic Initial Values →

© 2026 Reinforcement Learning Curriculum