티스토리 뷰

데이터분석 이론

통계 3. 표본 추출

데이터사이엔티스트 2021. 3. 14. 18:37

통계를 이용한 연구에서 연구대상의 전체를 모두 조사해 결과를 제시한다면 그 문제에 대해 문제를 제기하기는 힘드나,

 

모든 표본을 대상으로 연구를 하기에 많은 제약이 따르기에,

표본의 일부를 추출해서 통계분석을 진행하는 방법론을 표본 추출이라고 한다.

 

표본을 어떻게 추출하는가에 따라서 대표성이 있는지 없는지를 판단할 수 있기 때문이다.

-> 전체 집합에서 일부를 추출한 표본은 전체를 대표하는 대표성을 갖도록 만들어져야한다.

 

표본 추출은 크게 두 가지 섹션으로 나눈다

 

1. 확률적 표본 추출

- 단순무작위 표본 추출

가장 기본적인 추출 방법으로, 모집단의 각 사례의 수를 일정한 규칙에 의해 균등하게 기계적으로 뽑아내는 방법

주로 컴퓨터나 난수표 등을 이용, 표본의 크기가 작을 경우 표본 특성이 왜곡될 우려가 있다.

- 체계적 표본 추출

전체 모집단을 기준으로 번호를 부여한 뒤 일정한 간격으로  n~m번까지 기계적으로 표본을 추출하는 방법이다.

쉽고 정확하게 표본을 설정할 수 있음

- 비례층화 표본 추출

모집단이 여러 개의 이질적 집단으로 나뉘어 있는 경우, 각 집단을 이루는 비율에 따라 표본을 추출하는 방법

각 학년의 학생 수에 비례해서 학생 모집단을 비례해서 뽑는 경우

- 다단계층화 표본 추출

상위 표본 단위를 설정한 후, 그에 대한 하위 표본 단위를 설정해 추출하는 방법

예시) 대학교 기준 -> 단과 대학 기준 -> 학과별 추출 

- 군집 표본 추출

내부 이질적, 외부 동질적으로 구성된 군집들이 있는 모집단에서 전체를 조사하지 않고 몇 개의 군집을 선택해 조사하는 방법

서울시 자전거 구매의사를 조사할 때, 25개 전체 구에 대해서 조사하는 게 아니라 몇 개의 구만 선정해서 조사 진행

 

2. 비확률적 표본 추출

- 편의 표본 추출

조사자의 편의에 따라, 장소와 시간 등에 구애받지 않고 중요하다고 생각하는 표본을 임의로 추출하는 방법

- 판단 표본 추출

적합하다고 판단되는 구성원들을 표본으로 추출하는 방법

- 할당 표본 추출

내부 이질적, 외부 동질적인 기준인 연령, 학력, 직업 등 표본의 특성에 따라 적합하다 판단되는 기준으로 표본을 추출하는 방법

- 자발적 표본 추출

자발적 의지로 조사에 응하는 사람들을 표본으로 선택하는 방법