--- id: 5e8f2f13c4cdbe86b5c72da4 title: 'Aprendizagem de reforço com Q-Learning: Parte 2' challengeType: 11 videoId: DX7hJuaUZ7o bilibiliIds: aid: 420570359 bvid: BV1G341127zr cid: 409139190 dashedName: reinforcement-learning-with-q-learning-part-2 --- # --question-- ## --text-- O que pode acontecer se o agente não tiver um bom equilíbrio entre realizar ações aleatórias e usar ações aprendidas? ## --answers-- O agente sempre tentará minimizar sua recompensa pelo estado/ação atual, levando ao mínimo local. --- O agente sempre tentará maximizar sua recompensa pelo estado/ação atual, levando ao máximo local. ## --video-solution-- 2