Processing math: 27%
본문 바로가기

유용한 정보들/6 시그마(Six Sigma)

정규 분포 - 연속형 확률 변수의 분포

 

정규분포(Normal Distribution)는 다음과 같이 정의되는 확률 분포(Probability Distribution)입니다.

 

f(x)=12πσe(xμ)22σ2,<x<

 

여기서, π는 원주율(3.14159)을, e은 자연로그에서 밑인 네이피어 상수를 의미하며 근삿값은 2.71828인 실수입니다.

f(x)는 확률 밀도 함수(Probability density function)이라고 부릅니다.

 

가로축을 x로 세로축을 f(x)로 하는 그래프는 아래와 같이 좌우 대칭이며 종 모양의 형태를 가지고 있습니다. 이 확률 분포에 따르는 확률 변수의 평균은 μ, 분산은 σ^{2}가 됩니다.

 

 

정규분포 확률ㅂ밀도 함수

하나의 확률 변수 X가 평균은 \mu이고 표준편차가 σ인 정규분포를 따르는 확률변수이면 이를 기호 X\sim N(\mu, \sigma^{2})으로 표현합니다. N은 정규 분포의 영어, Normal distribution의 머리글자입니다.

 

정규분포 식은 복잡하지만 그에 따르는 확률 분포는 대부분 우리에게 익숙한 것들입니다.

예를 들어, 연필 생산 라인에서 생산되는 100그램으로 표시되는 연필에서 측정한 1개의 제품 무게, X는 확률 변수가 되지만, 그 확률분포의 확률 밀도 함수는 정규분포가 됩니다.

또 다른 예로 전국의 초등학생 4학년생 중 100명을 무작위로 선정하여 평균 키를 측정하였을 경우 무작위로 선정한 100명의 평균 키, X는 다르지만 그 확률 밀도 함수는 정규 분포가 됩니다. 

 

정규 분포 곡선은 몇 가지 중요한 성질을 가지고 있습니다.

첫째, 평균을 중심으로 좌우 대칭입니다. - (symmetric)

둘째, 종 모양입니다. - (Bell shaped)

셋째, 봉우리가 하나입니다. - (Single peaked)

정규 분포 곡선은 평균과 표준편차에 의해서 중심과 퍼짐의 정도가 다르지만 그 전반적인 모양은 변하지 않습니다.

 

 

확률 밀도 함수에서 어느 구간에 확률 현상이 일어날 확률은 그 구간에서 확률 밀도 함수와 가로축으로 둘러싸인 부분의 면적으로 나타낼 수 있습니다.

 

아래 그림과 같이 \mu ± \sigma의 구간에서 확률 현상이 일어날 확률, P(\mu-\sigma ≤ X ≤ \mu + \sigma)는 68.3%이며, \mu ± 2\sigma의 구간에서는 95.4%의 확률이 됩니다. 

 

정규분포 구간별 확률

정규 분포에서 평균이 0이고 표준편차가 1이 되는 정규 분포를 표준 정규 분포(Standard Normal distribution)라고 합니다.

확률 변수 Z가 표준 정규 분포를 따를 때, 이를 Z\sim N(0, 1)로 표시하며 표준 정규 분포의 확률 밀도 함수는 다음과 같습니다.

 

f(z) = \frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}},      -∞<z<∞

 

 

통계학 및 6 시그마에서는 평균값을 중심으로 95%의 범위를 자주 사용하는데 아래 그림과 같이 \mu ± 1.96\sigma의 경계점을 정규 분포의 양측 5% 점이라 합니다.

정규분포 양측 5 프로

규격 상한, 하한이 있으면 위의 양측 5% 점을 이용할 수 있지만 규격이 상한만 존재할 경우에는 왼쪽에서 오른쪽으로 걸친 95%의 범위를 사용할 수 있습니다. 이들 경계점은 \mu + 1.64\sigma에 위치하며 정규 분포의 상위 5%점이라고 합니다.

정규분포 상측 5 프로 구간