705 B
705 B
id | title | challengeType | videoId | bilibiliIds | dashedName | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
5e8f2f13c4cdbe86b5c72da4 | Apprendimento per rinforzo con Q-Learning: Parte 2 | 11 | DX7hJuaUZ7o |
|
reinforcement-learning-with-q-learning-part-2 |
--question--
--text--
Cosa può accadere se l'agente non ha un buon equilibrio tra l'intraprendere azioni casuali e l'utilizzare azioni apprese?
--answers--
L'agente cercherà sempre di minimizzare la sua ricompensa per lo stato o l'azione corrente, portando a minimi locali.
L'agente cercherà sempre di massimizzare la sua ricompensa per lo stato o l'azione corrente, portando a massimi locali.
--video-solution--
2