데이터분석 이론

통계 5. 분산분석

데이터사이엔티스트 2021. 3. 16. 23:07

표본이 1개 혹은 2개인 경우에는, t 검정을 사용했다.

표본이 3개 이상인 경우에는, 분산분석(Analysis of variance)를 사용한다. ANOVA 아노바로 읽음

 

일원분산분석

일원분산분석은 3개 이상의 표본에 대해 독립변수 1개인 경우 집단간 종속변수의 평균 차이를 비교하는 분석 방법

 

국내 편의점 중

1. 바이더웨이

2. 씨유

3. 세븐일레븐

4. 미니스탑

5. 지에스 25

 

에 대한 소비자 기준 만족도를 조사했다. 각 편의점에 대한 소비자 만족도의 차이가 있는지를 알아봅시다.

 

귀무가설: 편의점별 소비자의 만족도는 같다.

대립가설: 편의점별 소비자의 만족도는 다르다.

 

  제곱합 자유도 평균제곱 F 유의확률
집단-간 18.953 4 4.738 5.135 .001
집단-내 170.710 185 .923    
전체 189.663 189      

"집단 간의 만족도 차이가 있을까?"

유의확률 (p value)는 낮을수록, F 값은 높을수록 집단 간에 차이가 있다는 의미이다.

유의확률 .001으로 편의점 1~5까지의 집단 간 만족도의 차이는 존재한다.