03. 가설 검증
1. 가설 검증(Statiscal hypothesis testing)
가설 검증은 모집단에 대한 어떤 가설을 설정한 뒤에 표본 관찰을 통해 그 가설의 채택 여부를 결정하는 통계적 추론 방법이다.
귀무가설 (H0, Null hypothesis) |
• 가설검정의 대상이 되는 가설(연구자가 부정하고자 하는 가설) |
대립가설 (H₁, Anti hypothesis) |
• 귀무가설이 기각될 때 받아들여지는 가설 • 연구를 통해 입증 또는 증명되기를 기대하는 예상이나 주장 |
제1종 오류 (α error) |
• 귀무가설이 참인데 기각하게 되는 오류 |
제2종 오류 (β error) |
• 귀무가설이 거짓인데 채택하는 오류 |
유의수준(α) (Significance Level) |
• 1종 오류의 최대 허용 한계 • 유의수준 0.05(5%) - 100번 실험에서 1종 오류를 범하는 최대 허용 한계가 5번임을 의미함 |
기각역 (Critical Region) |
• 검정통계량의 분포에서 유의수준의 크기에 해당하는 영역 |
유의확률(p-value) (Probability Value) |
• 1종 오류를 범할 확률 • 귀무가설이 사실일 때 기각하는 제 1종 오류시 결정이 잘못되었을 확률 • p-value 0.05(5%) - 귀무가설을 기각했을 때 기각 결정이 잘못될 확률이 5%임 |
※ 1종 오류와 2종 오류를 동시에 줄일 수 없기 때문에 1종 오류를 범할 확률의 최대 허용치를 미리 특정값(유의 수준)으로 지정해 놓고 2종 오류를 가장 적게 해 주는 검정방법을 사용한다.
※ 예제 및 기출문제
1. 다음 중 추정과 가설검정에 대한 설명으로 부적절한 것은?
① 귀무가설이 사실일 때 검정 통계량이 나올 확률을 p-value라고 한다.
② 귀무가설을 기각하는 통계량의 영역을 기각역이라 한다.
③ 가장 참값이라고 여겨지는 하나의 모수의 값을 점 추정이라 한다.
④ 일정한 크기의 신뢰 수준으로 모수가 특정한 구간에 있을 것이라 선언하는 것을 구간 추정이라 한다.
2. 다음 중 가설검정에 관한 설명 중 옳지 않은 것은?
① 가능성이 크다 또는 작다의 판단 기준을 유의 수준이라 한다.
② 기각역이란 귀무가설이 옳다는 전제하에 구한 검정 통계량의 분포에서 확률이 유의 수준 α 인 부분을 말한다.
③ 유의 확률(p-value) 값이 미이 정해놓은 유의 수준 값보다 클 경우 귀무가설을 기각하고 대립 가설의 가정이 옳다고 할 수 있다.
④ 귀무가설이 참인데도 이를 기각하게 되는 오류를 제1종 오류라고 한다.
정답 : 1 - ①, 2 - ③
'ADsP 데이터 분석 준전문가 자격증' 카테고리의 다른 글
[데이터 분석 - 통계분석] 02. 통계적 추론 (0) | 2022.08.26 |
---|---|
[데이터 분석 - 통계분석] 01. 통계 분석 (0) | 2022.08.26 |
[데이터 이해] 06. 데이터 사이언스 (0) | 2022.08.26 |
[데이터 이해] 05. 빅데이터의 위기요인과 통제방안 (0) | 2022.08.26 |
[데이터 이해] 04. 빅데이터의 이해 (0) | 2022.08.26 |