Elements of Causal Inference Foundations
Chapter 3: Cause-Effect Models¶
SCM 的记号¶
假设有如下这样一个 SCM
所以如果\(N_E\)的值确定,为\(n_E\)时,\(E=f_e(C, n_e)\)是唯一确定的
如果记\(C\)和\(E\)的取值范围是\(\mathcal{C}\) 和\(\mathcal{E}\),那么可以将\(N_E\)的取值空间看作是\(C\mapsto E\)的函数,即\(E=n_E(e)\)
Intervention和 Counterfactual 的不同¶
假设\(C\)和\(E\)都是二值的,即\(\mathcal{E}=\mathcal{C}=\{0, 1\}\),那么\(N_E\)的取值范围是\(\{\mathbf{0}, \mathbf{1}, ID, NOT\}\),即恒为 0,恒为 1,全等和取反。假设现在有两个不同的\(P_{N_E}\),其中\(P_{N_E}^1\)有一半一半的概率是\(\mathbf{0}\)和\(\mathbf{1}\),\(P_{N_E}^2\)有一半一半的概率是\(ID\)或者\(NOT\)。那么此时两者有相同的边缘概率,\(P_{E|C=0}\)和\(P_{E|C=1}\),都是 50%概率的伯努利分布。而因为\(C\)是\(E\)的原因,所以\(P_{E|do(C)}\)和\(P_{E|C}\)总是恰好相等的。也就是说,不论做什么干预,都不影响\(E\)的分布。但是显然\(P_{N_E}^1\)和\(P_{N_E}^2\)的反事实是不一样的。对于前者,如果\(C\)取了不同的值,\(E\)的值不会变化,而后者则会变化。
我理解这里的区别在于噪声项\(N_E\)是否已经确定了,在反事实中,\(N_E\)的分布已经不是先验的P_{N_E}了
以上分析说明,两个不同的 SCM 可能导致相同的 interventional distribution。此外,两个不同的 SCM 还能导致相同的 counterfactual distribution。
对\(E := f_E(C, N_E)\)中的\(N_E\)进行重参数化显然不影响\(E\)的分布,所以假设有一个\(N_E\)取值范围上的一一映射\(g\),我们定义\(\tilde{N_E}=g(N_E)\),那么\(E := f_E(C, N_E)=f_E(C, \tilde{N_E})\)
Problems¶
Problem 3.6¶
Problem:
Given that
Show that \(P_{C|E=2}\) follows Gaussian distribution.
Solution:
根据贝叶斯公式
其中,
Problem 3.7¶
do(Y=constant),如果此时 X与Y不独立,那么是前者,否则是后者
Problem 3.8¶
b)
为了让SCM有解,可以设\(N_X=aN\), \(N_Y=bN\)
则上述方程可以变成
所以,可以令\(N_X\sim N(0, 1)\), \(N_Y:=-N_X\), \(X:=2N_X\), \(Y=-N_Y\)
Chapter 4: Learning Cause-Effect Models¶
Structure Identifiability¶
是否可以仅从联合分布\(P(X, Y)\),区分 X和 Y 的因果关系(即 strcuture)?答案是否定的,不行。
给定任何一个联合分布\(P(X, Y)\), 都可以找到一个SCM,其中\(Y:=f_Y(X, N_Y)\), \(X \perp \!\!\! \perp Y\)
所以,必须要做出一些假设,在这些假设成立的前提下才能实现 indentifiability
一般这样的假设有两类,一种是限制\(f_E\) 在一个比较小的类中,另一种是限制\(P(C)\)和\(P(E|C)\)。
We only argue for the belief that if there is a simple function that fits the data, it is more likely to also describe a causal relation
Linear models with Non-Gaussian Additive Noise¶
LiNGAM: \(E = \alpha C + N_E\)
Created : February 13, 2023