본문 바로가기

ADsP 데이터 분석 준전문가 자격증

[데이터 분석 - 통계분석] 03. 가설 검증

03. 가설 검증

1. 가설 검증(Statiscal hypothesis testing)

가설 검증은 모집단에 대한 어떤 가설을 설정한 뒤에 표본 관찰을 통해 그 가설의 채택 여부를 결정하는 통계적 추론 방법이다.

귀무가설
(H0, Null hypothesis)
• 가설검정의 대상이 되는 가설(연구자가 부정하고자 하는 가설)
대립가설
(H₁, Anti hypothesis)
• 귀무가설이 기각될 때 받아들여지는 가설
• 연구를 통해 입증 또는 증명되기를 기대하는 예상이나 주장
제1종 오류
(α error)
• 귀무가설이 참인데 기각하게 되는 오류
제2종 오류
(β error)
• 귀무가설이 거짓인데 채택하는 오류
유의수준(α)
(Significance Level)
• 1종 오류의 최대 허용 한계
유의수준 0.05(5%) - 100번 실험에서 1종 오류를 범하는 최대 허용 한계가 5번임을 의미함 
기각역
(Critical Region)
• 검정통계량의 분포에서 유의수준의 크기에 해당하는 영역
유의확률(p-value)
(Probability Value)
1종 오류를 범할 확률
귀무가설이 사실일 때 기각하는 제 1종 오류시 결정이 잘못되었을 확률
p-value 0.05(5%) - 귀무가설을 기각했을 때 기각 결정이 잘못될 확률이 5%임

※ 1종 오류와 2종 오류를 동시에 줄일 수 없기 때문에 1종 오류를 범할 확률의 최대 허용치를 미리 특정값(유의 수준)으로 지정해 놓고 2종 오류를 가장 적게 해 주는 검정방법을 사용한다. 

 

 

※ 예제 및 기출문제

 

1. 다음 중 추정과 가설검정에 대한 설명으로 부적절한 것은?

① 귀무가설이 사실일 때 검정 통계량이 나올 확률을 p-value라고 한다.

② 귀무가설을 기각하는 통계량의 영역을 기각역이라 한다.

③ 가장 참값이라고 여겨지는 하나의 모수의 값을 점 추정이라 한다.

④ 일정한 크기의 신뢰 수준으로 모수가 특정한 구간에 있을 것이라 선언하는 것을 구간 추정이라 한다.

 

2. 다음 중 가설검정에 관한 설명 중 옳지 않은 것은?

① 가능성이 크다 또는 작다의 판단 기준을 유의 수준이라 한다.

② 기각역이란 귀무가설이 옳다는 전제하에 구한 검정 통계량의 분포에서 확률이 유의 수준 α 인 부분을 말한다.

③ 유의 확률(p-value) 값이 미이 정해놓은 유의 수준 값보다 클 경우 귀무가설을 기각하고 대립 가설의 가정이 옳다고 할 수 있다.

④ 귀무가설이 참인데도 이를 기각하게 되는 오류를 제1종 오류라고 한다.

 

 

 

 

정답 : 1 - ①, 2 - ③