freeCodeCamp

1.6 KiB

Raw Blame History

title	localeTitle
Reinforcement Learning	Aprendizaje reforzado

Lectura sugerida:

http://incompleteideas.net/sutton/book/the-book-2nd.html

Aprendizaje reforzado

El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.

Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.

En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.

Lista de algoritmos comunes

Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas

Casos de uso:

Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.

1.6 KiB Raw Blame History

Lectura sugerida:

Aprendizaje reforzado

Lista de algoritmos comunes

Casos de uso:

1.6 KiB

Raw Blame History