2021-06-15 07:49:18 +00:00
|
|
|
---
|
|
|
|
id: 5e8f2f13c4cdbe86b5c72da3
|
2021-07-22 16:01:38 +00:00
|
|
|
title: Aprendizagem de reforço com Q-Learning
|
2021-06-15 07:49:18 +00:00
|
|
|
challengeType: 11
|
|
|
|
videoId: Cf7DSU0gVb4
|
2021-10-03 19:24:27 +00:00
|
|
|
bilibiliIds:
|
|
|
|
aid: 463025802
|
|
|
|
bvid: BV1iL411x7L6
|
|
|
|
cid: 409138811
|
2021-06-15 07:49:18 +00:00
|
|
|
dashedName: reinforcement-learning-with-q-learning
|
|
|
|
---
|
|
|
|
|
|
|
|
# --question--
|
|
|
|
|
|
|
|
## --text--
|
|
|
|
|
2021-07-22 16:01:38 +00:00
|
|
|
Os principais componentes da aprendizagem de reforço são...
|
2021-06-15 07:49:18 +00:00
|
|
|
|
|
|
|
## --answers--
|
|
|
|
|
2021-07-22 16:01:38 +00:00
|
|
|
ambiente, representante, estado, reação e recompensa.
|
2021-06-15 07:49:18 +00:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-22 16:01:38 +00:00
|
|
|
ambiente, agente, estado, ação e recompensa.
|
2021-06-15 07:49:18 +00:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-22 16:01:38 +00:00
|
|
|
habitat, agente, ação, estado e punição.
|
2021-06-15 07:49:18 +00:00
|
|
|
|
|
|
|
## --video-solution--
|
|
|
|
|
|
|
|
2
|
|
|
|
|