23 lines
1.6 KiB
Markdown
23 lines
1.6 KiB
Markdown
|
---
|
||
|
title: Reinforcement Learning
|
||
|
localeTitle: Aprendizaje reforzado
|
||
|
---
|
||
|
#### Lectura sugerida:
|
||
|
|
||
|
* http://incompleteideas.net/sutton/book/the-book-2nd.html
|
||
|
|
||
|
#### Aprendizaje reforzado
|
||
|
|
||
|
El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.
|
||
|
|
||
|
Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.
|
||
|
|
||
|
En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.
|
||
|
|
||
|
## Lista de algoritmos comunes
|
||
|
|
||
|
Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas
|
||
|
|
||
|
## Casos de uso:
|
||
|
|
||
|
Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.
|