freeCodeCamp/guide/spanish/machine-learning/principles/correlation-does-not-imply-.../index.md

3.2 KiB

title localeTitle
Correlation Does not Imply Causation La correlación no implica causa

La correlación no implica causa

Muchos sitios web relacionados con la actividad física y la salud a menudo se pierden este punto sobre la investigación que tiende a ocurrir en estos campos. Ellos reportan la investigación científica como una Causación distinta de lo que realmente es, Correlación. Por ejemplo. los investigadores encontraron que los madrugadores tienen un IMC más bajo y son menos obesos. Esta correlación puede ser tergiversada ya que "Despertarse temprano puede reducir las posibilidades de obesidad". No sabemos que el solo hecho de despertarse temprano "causó" el resultado: reducir la obesidad. Lo que hemos encontrado aquí es la correlación.

La definición informal de Correlación va como: cuando ocurre el evento A, el evento B también tiende a suceder y viceversa. O las personas que se despiertan temprano tienden a dirigirse hacia el extremo inferior del espectro de peso. Ambos eventos tienden a pasar juntos. Pero no es necesario que un evento haya provocado el otro.

La causalidad significa que el evento A 'causó' o condujo al suceso del evento B. Por ejemplo, Si me pongo al sol, me broncearía. Aquí entonces el segundo evento ocurre debido al primero.

En estadística, se habla mucho de variables correlacionadas . Una correlación es una relación entre dos variables. La causación se refiere a una relación en la que un cambio en una variable es responsable del cambio de otra variable. Esto también se conoce como una relación causal .

Cuando hay una relación causal entre dos variables, también hay una correlación entre ellas. Pero, una correlación entre dos variables no implica una relación causal entre ellas. Esta es una falacia lógica .

Esto se debe a que una correlación entre dos variables se puede explicar por muchas razones:

  • Una variable influye en la otra. Esta sería una relación causal. Por ejemplo, existe una correlación entre el salario familiar y el número de autos que posee.
  • Ambas variables se influyen entre sí. Esta sería una relación causal de dos vías. Por ejemplo, una correlación entre el nivel de educación y la riqueza de una persona.
  • Hay otra variable que está influenciando ambas variables bajo examen. Esto no sería una relación causal. Por ejemplo, la cantidad de autos que posee y el tamaño de la casa puede estar correlacionado, pero estas dos variables están influenciadas por otra variable: el salario. Un aumento en el número de autos que posee no influye en el tamaño de la casa.
  • La correlación podría ser un accidente aleatorio. Esto no sería una relación causal. Esta es la explicación para el ejemplo anterior de consumo de margarina y la tasa de divorcio en Maine.

En el aprendizaje automático, la correlación es suficiente para hacer un modelo predictivo. Sin embargo, solo porque dos variables estén correlacionadas no significa que una variable influya en la otra. En otras palabras, aunque el aprendizaje automático puede ayudar a encontrar una relación entre dos variables, no necesariamente ayuda a encontrar la razón de la relación.