Skip to main content

Learn
search
tags
Archives

Discriminator

Overall Progress 0%

Discriminator expert vs agent; use as reward for policy gradient.

Go to Chapter 77: Generative Adversarial Imitation Learning (GAIL) →

© 2026 Reinforcement Learning Curriculum