freeCodeCamp/guide/spanish/machine-learning/reinforcement-learning/index.md

---
title: Reinforcement Learning
localeTitle: Aprendizaje reforzado
---
#### Lectura sugerida:

*   http://incompleteideas.net/sutton/book/the-book-2nd.html

#### Aprendizaje reforzado

El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.

Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.

En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.

## Lista de algoritmos comunes

Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas

## Casos de uso:

Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.
fix: change directory structure 2018-10-12 19:37:13 +00:00			`---`
			`title: Reinforcement Learning`
			`localeTitle: Aprendizaje reforzado`
			`---`
			`#### Lectura sugerida:`

			`* http://incompleteideas.net/sutton/book/the-book-2nd.html`

			`#### Aprendizaje reforzado`

			`El aprendizaje de refuerzo se refiere a un campo de aprendizaje automático que se aplica a los agentes que usted refuerza otorgándoles recompensas y castigos. Proporciona un buen aprendizaje gradual y puede simplificar el aprendizaje del agente en tareas en las que no puede determinar un valor de error adecuado.`

			`Ejemplo: Al bot se le asigna una tarea para jugar a Space Invaders, trata de aprender a jugarlo interactuando con el juego y, a cambio, obtiene una recompensa por los puntos que anotó al final del juego. A mayor recompensa, mayores son sus posibilidades de hacer una jugabilidad similar. De esa manera, aprende a jugar el juego y a desempeñarse de la mejor manera posible.`

			`En las industrias, el robot utiliza el aprendizaje de refuerzo profundo para escoger un dispositivo de una caja y colocarlo en un contenedor. Ya sea que tenga éxito o falle, memoriza el objeto, adquiere conocimientos y se entrena para hacer este trabajo con gran velocidad y precisión. El aprendizaje por sí solo es un tipo de aprendizaje de refuerzo siempre que el aprendizaje se encuentre en una dimensión positiva.`

			`## Lista de algoritmos comunes`

			`Q-Learning Diferencia temporal (DT) Redes Adversariales Profundas`

			`## Casos de uso:`

			`Algunas aplicaciones de los algoritmos de aprendizaje de refuerzo son los juegos de mesa jugados por computadora (Chess, Go), manos robóticas y autos que conducen por sí mismos.`