1.6 KiB
title | localeTitle |
---|---|
Reinforcement Learning | Aprendizaje reforzado |
Lectura sugerida:
Aprendizaje reforzado
El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.
Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.
En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.
Lista de algoritmos comunes
Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas
Casos de uso:
Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.