본문 바로가기

유용한 정보들/6 시그마(Six Sigma)

통계적 가설 검증 방법

통계적 가설 검증은 표본 정보를 이용하여 표본의 정보가 우연이었을까 아니면 실질적인 정보일까을 검증하여 모집단의 특성/모수/모수들의 함수에 대한 의사 결정하는 방법입니다.

 

다음의 순서로 통계적 가설 검증를 수행합니다. 

1. 귀무가설을 설정합니다.

귀무가설(H0, Null Hypothesis): 기존에 알려진 사실을 간단하고 구체적으로 표현한 가설

대립가설(H1 또는 HA, Altermative Hypothesis): 사실임을 입증하고자 하는 가설

 

귀무가설은 관측된 차이가 단지 우연에 의한 결과라고 주장하는 입장이며, 대립가설은 관측된 차이가 실질적인 차이라고 주장하는 입장입니다.

예를 들어, 동전 던지기 게임의 경우를 생각해봅시다. 일반적인 동전은 앞면과 뒷면이 나올 확률이 50%씩으로 동일하지만 이 게임에서 사용하는 동전은 조금 수상해 보여서 10회를 던져 보았는데 8회가 앞면이 나왔습니다.

여기서 귀무가설은 우연히 앞면이 8회 나온 것이라고 주장하는 것이고, 대립가설은 이 동전은 앞면이 나오기 쉬도록 만들어진 동전이라고 주장하는 것입니다.

동전 던지기

2. 유의수준 α를 결정합니다.

제1종 오류를 범할 확률의 허용 한계인 유의수준을 사전에 정해두어야 합니다. 유의수준보다 작다면 우연이 발생한 것이 아니라 필연적인 의미가 있다고 하는 의미에서 유의하고 합니다.

유의 수준은 주관적으로 결정하지만 일반적으로 10%, 5%, 1%을 사용합니다.

 

제1종 오류(type Ⅰ error): 귀무가설이 옳은데도 불구하고 그것을 버리는 오류

제2종 오류(type Ⅱ error): 귀무가설이 잘못되었음에도 불구하고 그것을 버리지 못하는 오류

검정력(power): 귀무가설 H0가 잘못되었을 경우에 이 가설 H0를 기각할 확률 γ(감마)를 검출력 또는 검정력이라고 합니다.

 

제2종 오류의 확률을 β(베타)라고 하면 γ와 β는 다음의 관계가 성립합니다.

γ + β = 1

 

따라서 검정력(또는 검출력이라고도 부릅니다.) γ는 다음과 같이 표현됩니다.

γ = 1 - β

제1종오류와 제2종오류 검출력과의 관계

3. 귀무가설을 가정하고 검정 통계량 계산합니다.

가설 선택에 사용되는 통계량, 항상 귀무가설이 맞다는 가정 하에서 계산해야 합니다.

일반적으로 검정통계량은 표본에서 얻은 통계치와 귀무가설 하에서 기대되는 값 사이의 차이를 측정하고, 이 차이를 표준오차로 나누어 표준단위로 나타냅니다.

4. 관측된 유의 수준인 p-value 계산합니다.

H0 하에서 H0를 기각할 최소한의 유의 수준을 p-value 또는 p-값이라고 합니다.

p값은 어떤 사건이 우연히 발생할 확률로 p값이 0.05보다 작다는 것은 어떤 사건이 우연히 일어날 확률이 5%보다 작다는 의미로 이 사건이 우연히 발생할 가능성이 거의 없다고 보는 것입니다.

p-value는 귀무가설이 맞을 확률이 아니라, 귀무가설이 옳다고 가정 하에서 실제의 관측치 또는 그 이상으로 극단적인 관측치의 값을 얻을 확률을 나타냅니다. 따라서 이 확률이 작아질수록 귀무 가설에 대립되는 반대의 근거는 강해집니다.

5. p-value와 유의수준 α를 비교하여 H0 기각 여부 결정합니다.

p-value < α 이면 H0(귀무가설)를 기각합니다.

귀무가설을 기각할지 말 것이지와 관련해서는 사전에 기준이 필요합니다. 이 기준값을 유의수준(significance level)이라하고, α로 나타냅니다.

관측된 p-value에 대해서 사람마다 귀무가설이 맞다고 주장하는 사람도 있고 귀무가설이 틀렸다고 반대 주장하는 사람도 있을 수 있기 때문입니다. 따라서 반드시 사전에 미리 기준을 정해놓고 p-value을 판단해야 합니다.

H0를 기각할 때 통계적으로 유의하다(Statistically Significant)하고 합니다.

 

참고로 귀무가설이 기각되었을 경우 대립가설을 채택한다라고 표현할 수 있지만, 반대로 귀무가설이 기각되지 않을 경우 귀무가설을 채택한다라고 표현하지 않고 '귀무가설을 기각할 수 없다'라고 표현하는 것이 일반적인 표현입니다. 이유는 적극적으로 귀무가설을 찬성한다는 의미는 아니기 때문입니다.