538 B
538 B
id | title | challengeType | videoId | bilibiliIds | dashedName | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
5e8f2f13c4cdbe86b5c72da3 | Aprendizagem de reforço com Q-Learning | 11 | Cf7DSU0gVb4 |
|
reinforcement-learning-with-q-learning |
--question--
--text--
Os principais componentes da aprendizagem de reforço são...
--answers--
ambiente, representante, estado, reação e recompensa.
ambiente, agente, estado, ação e recompensa.
habitat, agente, ação, estado e punição.
--video-solution--
2