Minimality Assumption

Local Markov doesn’t Imply Dependencies

Local Markov 가정을 통해 우리는 Bayesian network factorization을 수행할 수 있었다. 그런데 중요하게 알아야 할 것이 있다.

DAG에서 , 가 인접하다고 해서 저 두 노드가 Dependent하다는 것을 의미하지는 않는다는 것이다. 엥?


그러니깐 의 간단한 그래프를 생각해보자. Bayesian Network Factorization을 하려면

로 표현할 수 있을 것이다.

그러나 두 노드가 이어져있다고 해서, 를 의미하는 것이 아니다. 즉 데이터에 따라서는

가 허용될 수도 있다..!

사이의 엣지는 사실 없어도 됐다는 것을 의미한다.

Minimality Assumption

만약 베이지안 네트워크를 통해 인과추론을 수행한다고 하면, 없어도 되는 가짜 인과관계가 표현되었다는 것. 그래서 인과추론이라는 태스크를 위해서는 가정이 더 필요하다.

따라서 인접한 노드들 간의 종속성을 보장하기 위해 Local Markov보다 좀 더 엄격한 가정인 Minimality Assumption을 가정하게 된다.

Minimality Assumption

  1. DAG가 주어졌을 때, 각 노드는 자신의 부모(parent) 노드가 given되면, 그래프 상에서 자신의 후손(descendant)이 아닌 다른 모든 노드와 독립이다. (Local Markov Assumption과 동일)
  2. DAG에서 인접한 두 노드(변수)는 서로 dependent하다. (추가된 가정!)

이 가정에 의하면, 엣지 하나라도 빼면 통계적 독립성을 그래프가 더 이상 설명하지 못하게 되는 상태가 된다. 즉 Minimality Assumption을 통해, 없어도 되는 엣지라는 것은 더이상 없다. 를 함의하므로, 와 같은 Facrorization은 허용되지 않는다.

왜 Minimality 라는 이름이 붙었는지도 어느 정도 짐작이 간다.

참고로, Minimality 가정은 Faithfulness 가정과는 엄연히 다른 개념이다. Faithfulness는 인과 그래프 학습(Causal Discovery)에서 쓰이는데, Faithfulness가 훨씬 더 강한 가정임을 알아두자.

Causal Graphs

Bayesian Network에서, Minimality Assumption을 추가하면 이제 그래프는 변수 간의 (조건부) 종속, 독립 관계를 표현할 수 있게 되었다.

마지막으로, 직접적으로 이어진 두 노드는 서로 인과적 관계라는 가정까지 추가하여 Causal Graph에 대한 셋업은 마무리 짓고자 한다.

Causal Edges Assumption

Directed graph에서, 모든 부모(parent) 노드는 그 자식(children) 노드의 직접적 원인이다.

DAG에서 이어진 두 노드들은 Dependent하다는 것이 Minimality 가정에 의해 만족이 되었지만, 실제로 인과적인가 하는 것은 또 다른 문제이기 때문에 이 가정이 필요하다.

뭐 아무튼, 우리가 이전 포스트와 이번에서 정리한 것을 정리하면 아래와 같다.

앞으로의 논의에서는 Causal Edges Assumption을 만족하는 것으로 기본적으로 가정한 상태로 진행할 것이다.


참고 자료: https://www.bradyneal.com/causal-inference-course