写给普通人的因果逻辑入门书-《别拿相关当因果！》（因果笔记）

因果推断入门书，除了之前介绍过的好书推荐-《结果与原因的经济学》极简因果推断教程，以及更为难懂的Peral的《为什么》，有一本阅读难度介于两者之间，但内容更加全面的《别拿相关当因果！因果关系简易入门》，书中分别详述了观察法，实验法，计算法三种评估因果关系的方法，讨论了因果分析中的解释及评价指标。本文记录了这本书中，让我个人记忆深刻的四个亮点。

2018年，评分4星，适合非统计背景入门，需要细读的一本书

别拿相关当因果因果关系简易入门

作者：[美]萨曼莎·克莱因伯格（Samantha Kleinberg）

当当

1 相关性不等于因果性，对其的理解有多个层面：最基础的是不是所有具有相关性的特征都能找到因果关系。接下来书中写道：具有因果关系，不等同于一定存在相关性，例如跑步可以减肥，但由于跑步后食欲增加，导致跑步和减肥之间不存在任何相关性。因果关系不应是相关性存在的唯一解释。

进一步的理解是相关性是对称的，而因果关系可能是不对称的，例如咖啡让人失眠并不意味着失眠一定会让人喝咖啡。相关性的对称性意味着两个相关特征之间的关系是线性的，而因果关系能够应对倒U型的曲线，这样的情况下，同样可能不存在相关性但存在因果关系。

从成因上看，相关性要求有变化，必须有多组数据点，而具有因果关系的两件事可以只发生一次。由此推出，基于变化的相关性，对观测的频率敏感，如果我们去考察不同层次的时间粒度，或者根据数据的不稳定性做一些调整，例如观察变化量而不是存量，相关性可能会消失，而因果关系不会。表示变量的方式（是将几个因素结合在一起还是一个一个单独研究）也会影响相关性推理的结果，但因果推断可以通过显著性区分虚假的因果关系

2 因果推理的方法不止一种，目前还没有哪一种方法能够在所有案例中都准确无误地找到事件之间的因果关系。有些方法得出的结论更具普遍性，但是这些结论取决于那些实际上不一定为真的假设。只知道一种寻找因果关系的方法并孜孜不倦地用它来解决每一个问题是不行的，我们需要的是一个工具箱。

大部分方法都可以通过调整来适应大部分案例，但调整后的方法既不是最简便的，也不是最有效的。我们研究的数据是离散的还是连续的会限制我们所使用的方法，因为很多方法只能适用于其中一种类型的数据。没有一种方法是完美的，所以一定要了解每一种方法的局限性。

在搜集和准备数据的过程中，我们所做的所有选择都会对最终推理出来的结论产生影响。因此，在决定使用哪些方法时，原因的用途和已有数据同样重要。用于面向未来的以预测为目地的研究，与回溯型寻找解释的研究，以及以找出最优干预方案为目地的研究，应当采取不同的因果推论方法。

3 因果关系的解释分为实体层面和统计层面。前者是关于某个具体事件的因果关系，而后者是可以用来预测未来事件的知识，或者是可以用来在普遍意义上（比如针对整个人口群体的政策）改变事件发展进程的知识。实体的因果关系能够帮助厘定法律责任与奖惩，是人们日常更关注的，用来解释生活中现象和动机的因果关系。

然而对于只会出现一次，永远都不会发生第二次的事件，我们可能在事件发生之前都不知道还存在这样的因果关系，这使得人们难以确定实体（也称为特定或实际）因果关系。之所以会这样，是由于一件事情的发生往往具有多重的原因，受到不确定性的影响，并且解释中充满了主观考量。

为了区分两者，需要注意研究具体案例发生概率的方法要与研究一般性案例的方法有所不同，通过研究我们想要解释的具体案例发生的概率是如何随着时间的变化而改变的，我们能够将一般会发生的事情和实际发生的事情区分开来，并且意识到一个一般情况下可以预防某种结果出现的原因也可能会成为导致这种结果出现的原因。

相比于基于统计的分析，在不改变统计假设的前提下，无法将全新的情况考虑进模型，从而得出脱离实际的、与直觉相矛盾的结论。而如果采用基于具体案例的研究，当事件A发生后，事件B发生的概率下降了，而在这种情况下事件B还是发生了，那么按照实体层面，应该认为事件B是在尽管有不利因素的情况下仍然发生了。不过难点在于我们很难知道事件B的概率是否下降，这是导致实体层面和统计层面的因果关系难以区分的原因。

4 对因果关系的评价，有以下几个层面，每种指标尤其对应的问题，分别是：

1) 强度：让一个事件发生的可能性更大（公布食物热量信息极大提高了人们购买低热量食物的概率），或指让某种影响的力度更大（公布食物热量信息导致人们购买的食物热量降低了一半）。强度大不等于因果关系存在。

2) 一致性（可重复性）: 能否在很多试验中都能观察到。在所有研究中都一致的发现也有可能是一个共同的缺陷或疏忽导致的。

3) 特异性：指一个原因导致的各种结果之间的差异，以及这个原因对每一个结果的影响程度。越直接的因果关系，特异性越高。特异性还意味着与一个似乎对每种结果都会产生重要影响的原因相比，一个更加具体的关系可能会为我们提供更加强有力的证据。如果我们对某个原因的作用机制以及它的主要影响一无所知，那么将无法得到特异性较高的推断，因此特异性取决于对具体问题的认知程度。

4) 时间间隔：即原因和结果之间隔了多长时间。我们是否会相信原因和结果之间会出现一个很长的时间间隔，这取决于我们已经掌握的信息。只有当人们知道其中的作用机制需要更长的运行时间时，才会在原因和结果之间的时间间隔较长时也认为存在某种因果关系。

5）剂量：考察随着原因的剂量增加，其引起的反应是否线性增加，还是剂量小就不会有影响。剂量和影响线性相关符合人们的直觉，然而很多情况下，因果关系呈现U型曲线，剂量低的一端风险更高，剂量中等时风险下降，然后在剂量高的时候风险又迅速回升。

6）可信度与连贯性：可信度指的是根据我们掌握的知识，我们能够想到某种方式来让我们研究的因果关系得以出现，连续性指当原因和结果联系在一起时，却与我们的认知并不矛盾。越古怪的因果关系，越需要高可信度的解释来说明为何会产生这样的联系。根据我们当下掌握的知识，我们会评价潜在的因果关系，会考察这个关系和我们通常认可的事实是否矛盾？它和我们的认知一致吗？

7）类比性：如果我们了解到有一个相似的因果关系，那就可以相应降低对证据的要求，因为这个相似的因果关系已经证明了某个原因是有可能导致我们想要证明的结果的。类比意味着可以利用关于动物的研究来更好地了解人类，或者可以将不同规模的各种系统连接在一起。

总结：

用四句话来概括这本书的带来的四个收获：

1 因果和相关性的本质差距来自于存在无法测定的因素

2 选择因果推断的方法，取决于推断的目的及相关领域的背景知识

3 具体事件的因果推断方法和统计上的因果联系有所不同

4 评价可能的因果关系存在多种维度

查看全文