이정민(서울대학교 경제학부), 최강우(서울대학교 경제학부 석박통합 1년차), 최준호(서울대학교 경제학부 석사)

이중차분법과 two-way fixed effect 모형

이중차분법(Difference-in-differences, DiD)은 경제학을 포함한 여러 학문 분야에서 데이터로 인과 관계를 추론하는 실증 연구를 위해 가장 널리 활용되는 방법 중 하나이다. 어떤 이항적인 처치(binary treatment)가 관심 있는 결과 변수에 미친 영향을 추정하기 위해 생각할 수 있는 단순한 방법은 처치 받은 집단 내에서 처치 전후의 결과 변수 평균값이 어떻게 바뀌었는지 비교하는 것이다. 그러나 이러한 방식은 처치 전후 두 관찰 시점 사이에 다른 어떤 요인이 작용해 결과 변수에 변화를 가져왔을 가능성을 남겨 둔다는 한계를 갖고 있다. 이러한 한계를 극복하기 위해 처치 받지 않은 적절한 통제 집단을 설정해, 그 통제 집단에서 같은 기간 동안 관찰된 결과 변수의 변화와 처치 집단에서 관찰된 변화를 비교할 수 있다. 만약 통제 집단의 변화가 처치 집단이 처치를 받지 않은 가상의 상황에서 두 관찰 시점 사이의 변화, 즉 처치가 아닌 각종 다른 요인에 의한 변화를 잘 반영한다면(parallel trends assumption), 두 집단에서 관찰된 변화의 차이는 오롯이 처치 효과라고 볼 수 있다. 처치 집단에서 관찰된 변화 중 처치 효과가 아닌 부분을 통제 집단에서 변화와 비교로 상쇄했기 때문이다.

이를 회귀식으로 풀어내면 아래와 같다:

$$ y=\beta_0+\beta_1t+\beta_2g+\beta_3T $$

(t: 처치 전후 시점 dummy, g: 처치 집단 dummy, T: t와 g의 곱, 즉 처치 여부)

Two-way fixed effect (TWFE) 모형은 이중차분법을 처치 전후의 여러 시점, 여러 처치 - 통제 집단 쌍으로 확장한 것이다. 예를 들어 전체 인구가 집단 1, 2, 3으로 나뉘어 각각에 순차적으로 같은 종류의 처치가 이뤄질 때, 전체 처치 집단에 대한 효과는 각 집단에 대한 처치 효과를 이중차분법으로 추정한 결과를 적절히 가중평균한 것으로 이해할 수 있다. 유사하게, 여러 시점의 관측치가 있다면 처치 직후 뿐 아니라 처치 이후 두 번째, 세 번째 시점의 결과 변수를 처치 이전의 결과와 비교한 이중차분법을 통해 더 장기적인 처치 효과를 추정할 수 있다. 이렇게 추정한 장, 단기 처치 효과를 가중평균해 전체 시점 간의 처치 효과를 얻는 static TWFE 모형과 장, 단기 처치 효과를 개별적으로 추정하는 dynamic TWFE 모형이 가능하다.

최근까지 경제학자들은 아래 회귀식이 위와 같은 직관에 맞게 처치 효과를 추정해 준다고 믿었다:

$$ y=\beta_0+\beta_1t+\beta_2g+\beta_3T $$

(t: 시점 fixed effect, g: 집단 fixed effect, T: 처치 여부)

위 회귀식은 이중차분법 추정을 위한 회귀식과 직접 대응되어, 시점과 처치 집단 dummy가 각각 시점과 집단 fixed effect로 바뀌었다는 차이만 있다. 처치 여부 T는 각 처치 집단의 서로 다른 처치 시점에 따라 정의한다. 마지막 항을 처치 시점으로부터 상대 시간 별로 구분해 여러 항으로 구성하면 dynamic TWFE model이 된다.

직관적으로 잘 돌아갈 것 같은 위 회귀식이 언제, 어떻게 우리가 생각한 추정치를 제공해주지 않는다는 걸까?

금지된 비교

Goodman-Bacon은 TWFE 회귀식에서 추정된 계수를 각 그룹들과 시점들 사이의 이중차분법 추정치로 분해해 이 질문에 답하고자 했다. 어떤 개체가 한 번 처치를 받으면, 뒤의 모든 관찰 시점에서 처치를 받은 상태를 유지한다고(staggered design) 가정한다. 이때 분해의 결과는 다음과 같다 (Goodman-Bacon, 2021):

$$ \hat\beta=\sum_{g\neq g', t\neq t'}v_{g, g', t, t'}DiD_{g, g', t, t'} $$

where

$$ v_{g, g', t, t'}\geq0, \sum_{g\neq g', t\neq t'}v_{g, g', t, t'}=1, DiD_{g, g', t, t'}=(Y_{g, t'}-Y_{g, t})-(Y_{g', t'}-Y_{g', t}) $$

처치 집단 g는 t 시점과 t’ 시점의 처치 여부가 서로 다르고, 통제 집단 g’은 두 시점의 처치 여부가 서로 같은 경우에만 0이 아닌 가중치 v가 부여된다. 따라서, $\hat{\beta}$에는 t 시점과 t’ 시점에 줄곧 처치를 받은 상태였던 g’를 통제 집단으로 활용한 이중차분법 추정치도 반영된다. 일반적으로 이는 평행 추세 가정(parallel trends assumption) 하에서도 해당 집단 및 시점에 대한 처치 효과의 불편추정량(unbiased estimator)이 아니다. 그로 인해 이를 포함한 $\hat{\beta}$ 역시 편향을 가진다. 이를 TWFE 모형의 금지된 비교(forbidden comparison) 문제라고 부른다.

  1. Staggered design이고 2. 처치는 이항적(binary)이며 3. 모든 집단의 처치 시점이 동일하면 TWFE 모형의 추정치가 편향을 갖지 않는다. 그 외에도 평행 추세 가정에 더해 특수한 가정들을 두면 TWFE 모형이 불편추정량을 제공한다는 사실을 보일 수 있다(de Chaisemartin & D’Haultfoeuille, 2020; 2022).