정규분포(normal distribution)는 가장 대표적인 연속 확률 분포(continuous probability distribution)이며 가우스 분포(Gaussian distribution)라고도 합니다.
일반적으로 정규분포는 평균은 μ이고 표준편차가 σ 일 때, 다음과 같이 표현합니다.
정규분포는 다양한 분야에서 가장 널리 사용 중입니다. 이유는 중심 극한 정리(central limit theorem, CLT) 정리에 의해서 모집단의 확률 분포를 알 수 없는 경우에도 크기 n의 표본을 추출하여 표본의 평균이 X라고 할 때, 표본의 크기 n이 커질수록 표본 평균 X의 확률분포는 정규분포에 가까워지는 특성 때문입니다.
표준 정규분포(standard normal distribution)란 정규분포의 모수인 평균이 0이고 분산이 1로 표준화된 분포를 말합니다.
표준 정규분포를 사용하는 이유는 확률 계산이 용이하고 서로 다른 산포 또는 단위를 갖는 경우 상호 비교가 가능합니다.
표준 정규분포를 이용하여 산포가 다른 경우 상호 비교가 가능한데, 예를 통하여 알아봅시다.
홍길동이 기말고사에서 수학 시험은 70점, 영어 시험은 90점을 받았습니다. 과목별 시험 성적의 평균과 표준편차가 다음과 같을 경우 수학과 영어 시험 중 어떤 과목을 더 잘 보았다고 할 수 있을까요?
- 수학시험 : 전체 평균 = 60점, 표준편차 = 5점
- 영어시험 : 전체 평균 = 80점, 표준편차 = 10점
표준화를 하지 않고 그대로 비교하면 홍길동은 영어 시험이 90으로 수학 시험 70점보다 20점 더 좋은 성적을 받았다고 생각할 수 있습니다.
하지만 표준화를 적용해보면 다음과 같습니다.
- 수학 시험 : Z = (X - μ) / σ = (70 - 60) / 5 = 2
- 영어 시험 : Z = (X - μ) / σ = (90 - 80) / 10 = 1
따라서, 홍길동은 수학시험이 영어시험보다 더 좋은 성적을 받았다는 것을 알 수 있습니다.
표준 정규분포는 아래와 같이 표준 정규분포 표가 사전에 작성되어 있기 때문에 확률 계산이 아주 용이합니다.
단, 주의할 것은 어떤 확률에 해당하는 표준 정규분포 표인지 반드시 확인하고 사용하여야 합니다.
모든 표준 정규분포 표에는 상단에 어떤 영역의 확률인지 그림으로 표현되어 있습니다.
표준 정규분포 표를 이용하여 확률을 구하는 방법은 Z 값을 구하였으면 아래와 같이 소수점 첫 번째 자리까지(①)와 소수점 두 번째 자리(②)를 찾아서 만나는 위치(③)의 값을 확률 값으로 가져오면 됩니다.
예를 들어 Z = 1.05라고 할 때, 소수점 첫 번째 자리까지의 수 1.0을 찾고, 소수점 두 번째 수 0.05를 찾아서 교차하는 위치의 수, 0.8531을 찾으면 됩니다.
'유용한 정보들 > 6 시그마(Six Sigma)' 카테고리의 다른 글
실험 계획법(DOE)과 5가지 기본 원리 (0) | 2020.10.31 |
---|---|
일원배치 분산분석(ANOVA 분석) 개념 정리 (5) | 2020.10.26 |
통계적 가설 검증 방법 (0) | 2020.10.18 |
중심 극한 정리와 큰 수의 법칙(대수의 법칙) (0) | 2020.10.13 |
정규 분포 - 연속형 확률 변수의 분포 (0) | 2020.10.11 |