freeCodeCamp/curriculum/challenges/ukrainian/11-machine-learning-with-py.../tensorflow/reinforcement-learning-with...

1016 B

id title challengeType videoId bilibiliIds dashedName
5e8f2f13c4cdbe86b5c72da4 Навчання з підкріпленням за допомогою Q-Learning: Частина 2 11 DX7hJuaUZ7o
aid bvid cid
420570359 BV1G341127zr 409139190
reinforcement-learning-with-q-learning-part-2

--question--

--text--

Що може статися, якщо агент не матиме необхідного балансу між реалізацією випадкових дій та попередньо вивчених дій?

--answers--

Агент завжди намагатиметься мінімізувати винагороду за поточний стан/дію, призводячи до локального мінімуму.


Агент завжди намагатиметься максимізувати винагороду за поточний стан/дію, призводячи до локального максимуму.

--video-solution--

2