--- title: Correlation Does not Imply Causation localeTitle: 相关性并不意味着因果关系 --- ## 相关性并不意味着因果关系 许多与健身和健康相关的网站经常忽略这一点,即在这些领域中经常发生的研究。他们将科学研究报告为因果关系而不是实际情况,即相关性。例如。研究人员发现,早起者的BMI较低,并且发现肥胖较少。这种相关性可能被误解为“早起就可以减少肥胖的机会”。我们不知道只是早起'造成'结果 - 降低肥胖。我们在这里找到的是相关性。 相关性的非正式定义如下:当事件A发生时,事件B也倾向于发生,反之亦然。或者早起的人倾向于朝向体重谱的低端。这两件事都倾向于一起发生。但是一个事件没有必要引起另一个事件。 因果关系意味着事件A'引起'或导致事件B发生。例如。如果我站在阳光下,我会晒黑。这里第二个事件因为第一个而发生。 在统计学中,有很多关于**相关变量**的讨论。相关性是两个变量之间的关系。 **因果关系**是指一种关系,其中在一个变量的变化**是负责**另一个变量的变化。这也称为**因果关系** 。 当两个变量之间存在因果关系时,它们之间也存在相关性。但是,两个变量之间的相关性并不意味着它们之间存在因果关系。这是一个[合乎逻辑的谬误](https://en.wikipedia.org/wiki/Formal_fallacy) 。 这是因为两个变量之间的相关性可以解释为多种原因: * 一个变量影响另一个变量。这_将_是一种因果关系。例如,家庭工资和拥有的汽车数量之间存在相关性。 * 两个变量都相互影响。这_将_是一种双向因果关系。例如,教育水平与人的财富之间的相关性。 * 还有另一个变量正在影响检查中的两个变量。这_不是_因果关系。例如,拥有的汽车数量和房屋的大小可能是相关的,但这两个变量受另一个变量的影响:工资。拥有的汽车数量的增加不会影响房屋的大小。 * 相关可能是一次随机事故。这_不是_因果关系。这是对前一个人造黄油消费和缅因州离婚率的例子的解释。 在机器学习中,相关性足以制作预测模型。然而,仅仅因为两个变量是相关的并不意味着一个变量影响另一个变量。换句话说,虽然机器学习可能有助于找到两个变量之间的关系,但它并不一定有助于找到关系的原因。