본문 바로가기
Today I Learned!/Data Science

통계학 (7) - Three-way ANOVA

by ENTJ의 자기계발 2023. 12. 10.

- 이 글은 유튜브 Sapientia a Del, 곽기영 교수님, 통계파랑 님을 참고하였습니다.

 

 

Three-way ANOVA 


- 3원 분산분석도 가능하나 해석이 복잡하고 어려워질 것

- 3개일 경우 :  main effect 3개 & two-way interaction 3개 $a\times b / b\times c / c\times a $ & three-way interaction 1 개$a\times b\times c$

 ⇒ 왠만하면 two-way를 넘기지 않음

- F-value 계산

  - 3개의 main effect에 대한 SS/df는 기존과 동일

  - two-way interaction : 변수 A와 B의 interaction effect는 다른 변수 C의 모든 그룹(=레벨)의 평균을 전제하고 난 후(고정), 변수 A의 효과가 모든 그룹(=레벨)의 변수에서 똑같이 나타나는지 아닌지 확인 (B, C도 동일)

$$ SS_{A\times B}=SS_{AB}-SS_A-SS_B,\quad df_{A\times B)=(a-1)\times(b-1)$$

$$ SS_{A\times C}=SS_{AC}-SS_A-SS_C,\quad df_{A\times C)=(a-1)\times(c-1)$$

$$ SS_{B\times C}=SS_{BC}-SS_B-SS_C,\quad df_{B\times C)=(b-1)\times(c-1)$$

  - three-way interaction : $interaction_{A\times B}$의 효과가 모든 레벨(=그룹)의 변수 C에서 똑같이 나타나는지 (B,C도 동일) 

    - 그래프도 3D가 되어서 복잡

$$ SS_{A\times B\times C}=SS_{ABC}-SS_{AB}-SS_{AC}-SS_{BC}-SS_A-SS_B-SS_C,\quad  df_{A\times B\times C)=(a-1)\times(b-1)\times(c-1)$$

$$SS_{within} = SS_{Total}-SS_A-SS_B-SS_C-SS_{A\times B}-SS_{A\times C}-SS_{B\times C}-SS_{A\times B\times C},\quad df_{within}=N-abc $$

 

 

고차원 분산분석


- 분석은 가능하나, 분석의 목적에 맞게 중요한 변수를 중심으로 분석하는 것이 필요

- 통계의 Parsimonious 개념

  - 가장 단순한 모델을 바탕으로 최소한의 전제조건과 변수를 이용해 분석할 때 가장 훌륭한 결과와 해석 가능

  - 통계분석의 목적이 학문적 연구일 경우 이론과 모델을 바탕으로 해야하며, 목적이 실질적인 이득을 위한경우에도 parsimonious 원칙은 중요

 

 

댓글