본문 바로가기
Today I Learned!/Data Science

통계학 (10) - 조절효과와 매개효과

by ENTJ의 자기계발 2023. 12. 19.

- 이 글은 유튜브 Sapientia a Del, 곽기영 교수님, 통계파랑 님을 참고하였습니다.

 

 

 

조절효과(Moderating Effect)


- 독립변수와 종속변수의 관계(선형, 회귀계수)에서 방향 또는 힘의 크기의 변화시키는 변수

예) 종속변수 : 지출 / 독립변수 : 수입 / 조절변수 : 성별

1) 기본 회귀식 $ y_i = α + \beta_1 x_i $

2) 기본 회귀식 + 성별 더미변수 추가 $ y_i = α + \beta_1 x_i +\beta_2 D_i $

  - 절편의 변화

$$ 남성의\ 회귀식(기본\ 회귀식과\ 동일) y_i=α +\beta_1X_i,\quad 여성의 회귀식 y_i = (α + \beta_2)+\beta_1X_i$$

3) 조절효과 회귀식(interaction term 추가)$ y_i = α + \beta_1 x_i +\beta_2 D_i +β_3 X_i\times D_i $

$$ 남성의\ 회귀식(기본\ 회귀식과\ 동일) y_i=α +\beta_1X_i,\quad 여성의 회귀식 y_i = (α + \beta_2)+(\beta_1+\beta_3)X_i$$

  - β 가 유의할 경우, 절편과 기울기에 모두 영향 : $\beta_2$유의할 경우, 여성의 평균지출금액이 남성보다 유의하게 많다는 것, $\beta_3$유의할 경우, 여성과 남성의 수입이 동일하게 1 증가할 경우 여성의 지출이 남성보다 유의하게 많이 증가한다는 것 의미

  = > interaction 항의 회귀계수가 유의하면 조절효과가 있는 것

 

- 조절효과 확인

  - 기존의 독립변수에 조절변수를 추가적인 독립변수 및 두 변수를 곱한 교호작용변수를 투입하고, 교호작용변수가 유의한지 확인

  - 조절효과는 선형관계를 확인하는 회귀분석에서 비선형관계(일방적인 관계가 변화하는 관계)를 알 수 있는 귀한 방법

 

- 추천 논문 : Baron, R. M., & Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51(6), 1173–1182. https://doi.org/10.1037/0022-3514.51.6.1173.

 

 

 

매개 효과(Mediating Effect)


- 독립변수가 종속변수에 유의한 영향을 미칠 때, 그 사이에서 매개 변수를 통해 그 영향이 전달되는 경우 : X → M → Y

- 매개의 종류에 의해 매개변수 없이는 독립변수의 영향이 종속변수에 다다르지 못하는 경우가 있음

 

- 부분매개효과 : X가 Y에 직접적으로 미치는 효과와, M을 거쳐서 Y에 미치는 효과 동시 존재

- 완전매개효과 : M을 거쳐서 Y에 미치는 효과 존재

 

- 매개효과 검증방법

  - 회귀분석 3단계

  1) X→M : X는 M에 대해 무조건 유의해야 함, $M=\alpha+\beta_1X$

  2) X→Y : X는 Y에 대해 무조건 유의해야 함, $Y=α + \pi X$

  3) X+M→Y : 2단계 회귀식에 매개변수가 새로 추가된 상황에서 $ Y=α + \beta_2 X+\beta_3 M

    - M은 무조건 유의해야 함

    - X가 유의(2단계)에서 유의하지 않음(3단계)이면 M은 완전매개

    - X가 2,3단계에서 모두 유의하면 M은 부분매개

 

- 총 효과 : 직접효과와 간접효과의 합 = $\beta_2 + (\beta_1 \times \beta_3)$

- 간접효과의 문제

  - 2단계에서 3단계로 갈 때, 언제나 독립변수 X에 대한 회귀계수의 크기가 작아짐, $ \pi > \beta_2 $

  - 간접효과 = $\pi -\beta_2 = \beta_1 \times \beta_3$ : 독립변수와 매개변수의 분산이 겹치면서 종속변수의 분산을 설명한 부분

 

- Sobel 테스트 : 세 가지가 겹치는 부분의 면적이 얼마나 큰지 확인, 간접효과(두 회귀계수의 곱)가 유의한지 알아보는 테스트

  - $1단계\ M=\alpha+beta_1 X,\quad 2단계\ Y=\alpha+\pi X, \quad 3단계 Y=\alpha+\beta_2M+\beta_3M$

  - $\beta_1$과 그 표준오차 & $\beta_3$와 그 표준오차 필요

  $$t-value=\frac{\beta_1 \times \beta_3}{\sqrt{(\beta^2_1 \times SE_{\beta_3})+(\beta^2_3 \times SE_{\beta^2_1})}}$$

- Sobel 테스트의 문제 $\pi - \beta_2 \neq \beta_1 \times \beta_3$ ⇒ bootstraping(resampling 반복)으로 해결

  - 이론적인 간접효과가 sobel test의 효과와 달라짐, 보통 missing value로 인한 샘플사이즈 변동에 따라 발생

  - 두 회귀계수의 cross product인 $\beta_1 \times \beta_3$의 분포가 불분명

    - 우리의 데이터가 정규분포라도, 회귀계수의 분포는 불분명

 

 

 

 

댓글