freeCodeCamp/guide/spanish/machine-learning/reinforcement-learning/index.md

23 lines
1.6 KiB
Markdown
Raw Normal View History

2018-10-12 19:37:13 +00:00
---
title: Reinforcement Learning
localeTitle: Aprendizaje reforzado
---
#### Lectura sugerida:
* http://incompleteideas.net/sutton/book/the-book-2nd.html
#### Aprendizaje reforzado
El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.
Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.
En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.
## Lista de algoritmos comunes
Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas
## Casos de uso:
Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.