freeCodeCamp/curriculum/challenges/portuguese/11-machine-learning-with-py.../tensorflow/reinforcement-learning-with...

31 lines
669 B
Markdown
Raw Normal View History

---
id: 5e8f2f13c4cdbe86b5c72da4
title: 'Aprendizagem de reforço com Q-Learning: Parte 2'
challengeType: 11
videoId: DX7hJuaUZ7o
bilibiliIds:
aid: 420570359
bvid: BV1G341127zr
cid: 409139190
dashedName: reinforcement-learning-with-q-learning-part-2
---
# --question--
## --text--
O que pode acontecer se o agente não tiver um bom equilíbrio entre realizar ações aleatórias e usar ações aprendidas?
## --answers--
O agente sempre tentará minimizar sua recompensa pelo estado/ação atual, levando ao mínimo local.
---
O agente sempre tentará maximizar sua recompensa pelo estado/ação atual, levando ao máximo local.
## --video-solution--
2