freeCodeCamp/guide/chinese/machine-learning/principles/correlation-does-not-imply-.../index.md

24 lines
2.5 KiB
Markdown
Raw Normal View History

---
title: Correlation Does not Imply Causation
localeTitle: 相关性并不意味着因果关系
---
## 相关性并不意味着因果关系
许多与健身和健康相关的网站经常忽略这一点即在这些领域中经常发生的研究。他们将科学研究报告为因果关系而不是实际情况即相关性。例如。研究人员发现早起者的BMI较低并且发现肥胖较少。这种相关性可能被误解为“早起就可以减少肥胖的机会”。我们不知道只是早起'造成'结果 - 降低肥胖。我们在这里找到的是相关性。
相关性的非正式定义如下当事件A发生时事件B也倾向于发生反之亦然。或者早起的人倾向于朝向体重谱的低端。这两件事都倾向于一起发生。但是一个事件没有必要引起另一个事件。
因果关系意味着事件A'引起'或导致事件B发生。例如。如果我站在阳光下我会晒黑。这里第二个事件因为第一个而发生。
在统计学中,有很多关于**相关变量**的讨论。相关性是两个变量之间的关系。 **因果关系**是指一种关系,其中在一个变量的变化**是负责**另一个变量的变化。这也称为**因果关系** 。
当两个变量之间存在因果关系时,它们之间也存在相关性。但是,两个变量之间的相关性并不意味着它们之间存在因果关系。这是一个[合乎逻辑的谬误](https://en.wikipedia.org/wiki/Formal_fallacy) 。
这是因为两个变量之间的相关性可以解释为多种原因:
* 一个变量影响另一个变量。这_将_是一种因果关系。例如家庭工资和拥有的汽车数量之间存在相关性。
* 两个变量都相互影响。这_将_是一种双向因果关系。例如教育水平与人的财富之间的相关性。
* 还有另一个变量正在影响检查中的两个变量。这_不是_因果关系。例如拥有的汽车数量和房屋的大小可能是相关的但这两个变量受另一个变量的影响工资。拥有的汽车数量的增加不会影响房屋的大小。
* 相关可能是一次随机事故。这_不是_因果关系。这是对前一个人造黄油消费和缅因州离婚率的例子的解释。
在机器学习中,相关性足以制作预测模型。然而,仅仅因为两个变量是相关的并不意味着一个变量影响另一个变量。换句话说,虽然机器学习可能有助于找到两个变量之间的关系,但它并不一定有助于找到关系的原因。