title

challengeType

videoId

bilibiliIds

dashedName

5e8f2f13c4cdbe86b5c72da4

Apprendimento per rinforzo con Q-Learning: Parte 2

DX7hJuaUZ7o

aid	bvid	cid
420570359	BV1G341127zr	409139190

reinforcement-learning-with-q-learning-part-2

--question--

mirror of https://github.com/freeCodeCamp/freeCodeCamp.git

--text--

Cosa può accadere se l'agente non ha un buon equilibrio tra l'intraprendere azioni casuali e l'utilizzare azioni apprese?

L'agente cercherà sempre di minimizzare la sua ricompensa per lo stato o l'azione corrente, portando a minimi locali.

L'agente cercherà sempre di massimizzare la sua ricompensa per lo stato o l'azione corrente, portando a massimi locali.