更好的阅读体验D-SeparationD-separation是贝叶斯网络中的一个概念用于通过图结构DAG随机变量之间的条件独立性首先需要回顾一下的是在图中只要给定了某个节点的所有父节点那么该节点就与其所有祖先节点在逻辑上是相互独立的A node is conditionally independent of all its ancestor nodes in the graph given all of its parents.Causal Chain( 因果链 )没有被给定这时X和Z不是独立的因为信息可以沿着链来传递给定Y这时候X和Z关于Y条件独立(X⊥⊥Z∣Y)这时候就用到了最开始提到的定理只要给定了某个节点的所有父节点那么该节点就与其所有祖先节点在逻辑上是相互独立的此时X和Z是独立的也可以通过公式来证明HINT: 记得回顾一下链式法则还有独立性P ( X ∣ Z , y ) P ( X , Z , y ) P ( Z , y ) P ( Z ∣ y ) P ( y ∣ X ) P ( X ) ∑ x P ( x , y , Z ) P ( Z ∣ y ) P ( y ∣ X ) P ( X ) P ( Z ∣ y ) ∑ x P ( y ∣ x ) P ( x ) P ( y ∣ X ) P ( X ) ∑ x P ( y ∣ x ) P ( x ) P ( X ∣ y ) \begin{align*} P(X\mid Z,y) \frac{P(X,Z,y)}{P(Z,y)} \frac{P(Z\mid y)P(y\mid X)P(X)}{\sum_x P(x,y,Z)} \frac{P(Z\mid y)P(y\mid X)P(X)}{P(Z\mid y)\sum_x P(y\mid x)P(x)} \\ \frac{P(y\mid X)P(X)}{\sum_x P(y\mid x)P(x)} P(X\mid y) \end{align*}P(X∣Z,y)P(Z,y)P(X,Z,y)∑xP(x,y,Z)P(Z∣y)P(y∣X)P(X)P(Z∣y)∑xP(y∣x)P(x)P(Z∣y)P(y∣X)P(X)∑xP(y∣x)P(x)P(y∣X)P(X)P(X∣y)Common Cause( 共同原因 )没有被给定XZ不是独立的因为他们共同受到了Y的影响。给定YX 和 Z 关于 Y条件独立(X⊥⊥Z∣Y)。知道 Y 之后X 和 Z 之间的关联被解释再无其他联系同样可以通过公式来证明P ( X ∣ Z , y ) P ( X , Z , y ) P ( Z , y ) P ( X ∣ y ) P ( Z ∣ y ) P ( y ) P ( Z ∣ y ) P ( y ) P ( X ∣ y ) \begin{align*} P(X\mid Z,y) \frac{P(X,Z,y)}{P(Z,y)} \frac{P(X\mid y)P(Z\mid y)P(y)}{P(Z\mid y)P(y)} P(X\mid y) \end{align*}P(X∣Z,y)P(Z,y)P(X,Z,y)P(Z∣y)P(y)P(X∣y)P(Z∣y)P(y)P(X∣y)Common Effect没有被给定:X⊥⊥Z没有任何给定没有理由认为两个无关的原因有关联给定YX和Z不独立X和Z会对Y产生的原因产生explaining away( 解释竞争 )。D-Seperation判定算法给定贝叶斯网络 G节点 X和 Y以及观测节点集合 Z{Z 1 Z_1Z1,…,Z k Z_kZk}要判断 X⊥⊥Y∣Z是否保证成立即 D-separate步骤如下:阴影化观测节点在图中将Z 中的所有节点涂灰代表它们已被观测枚举 X 到 Y 的所有无向路径忽略箭头的方向找出所有从 X 到 Y 的路径节点不重复即可不要担心循环但通常考虑简单路径- 将路径分解为连续的三节点片段。检查每个三节点片段是否是活跃的根据上述规则。如果所有片段都是活跃的则该路径是活跃的active path它D-connectsX 和 Y意味着 X 和 Y不一定条件独立。结论:如果不存在任何活跃路径则 X⊥⊥Y∣Z被保证成立D-separated。如果存在至少一条活跃路径则不能保证条件独立可能依赖也可能不依赖取决于具体概率值。主要需要留意的是如果只有一条路径这条路径上只要有一个三元组是Inactive Triples,那么这条路径就是Inactive的条件一定是独立的。如果有多条路径只要有一条路径是Active,即便其它路径都是Inactive,也就是说不能忽略Active路径展示的相关性不能证明条件是独立的Active triplesInactive triplesExample