Hopper

Overall Progress 0%

Compare SAC and PPO on Hopper, Walker2d; when to choose which.

Go to Chapter 48: SAC vs. PPO →

Random policy dataset on Hopper; naive SAC overestimation.

Go to Chapter 71: The Offline RL Problem →