본문 바로가기

ADsP 데이터 분석 준전문가 자격증

(22)
[데이터 분석 - 통계분석] 03. 가설 검증 03. 가설 검증 1. 가설 검증(Statiscal hypothesis testing) 가설 검증은 모집단에 대한 어떤 가설을 설정한 뒤에 표본 관찰을 통해 그 가설의 채택 여부를 결정하는 통계적 추론 방법이다. 귀무가설 (H0, Null hypothesis) • 가설검정의 대상이 되는 가설(연구자가 부정하고자 하는 가설) 대립가설 (H₁, Anti hypothesis) • 귀무가설이 기각될 때 받아들여지는 가설 • 연구를 통해 입증 또는 증명되기를 기대하는 예상이나 주장 제1종 오류 (α error) • 귀무가설이 참인데 기각하게 되는 오류 제2종 오류 (β error) • 귀무가설이 거짓인데 채택하는 오류 유의수준(α) (Significance Level) • 1종 오류의 최대 허용 한계 • 유의수준..
[데이터 분석 - 통계분석] 02. 통계적 추론 02. 통계적 추론 1. 모수적 추론과 비모수적 추론 모수적 추론 • 모집단에 특정 분포를 가정하고 모수에 대한 추론 • 자료가 정규분포, 등간척도, 비율척도인 경우 비모수적 추론 • 모집단에 대해 특정 분포를 가정하지 않음 • 모수 자체보다 분포 형태에 관한 검정을 실시함 • 표본 수가 적고, 명목 척도, 서열 척도인 경우 - 부호검정, 위콕스의 순위합 검정, 만-위트지의 U검정 2. 점 추정과 구간 추정 점추정 • 통계량 하나를 구하여 그것을 가지고 모수를 추정하는 방법 • 모수가 특정한 값일 것이라고 추정하는 것 구간 추정 • 점추정의 정확성을 보완하는 방법 • 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것 신뢰구간 • 모수가 포함되리라고 기대되는 범위 • 표본의 크기가..
[데이터 분석 - 통계분석] 01. 통계 분석 01. 통계 분석 1. 통계 분석 개요 모집단 (Population) 잘 정의된 연구목적과 이와 연계된 연구 대상(데이터의 전체 집합) 모수 (Parameter) 모집단의 특성을 나타내는 수치들 표본 (Sample) 모집단의 개체 수가 많아 전부 조사하기 힘들때 모집단에서 추출한 것 통계량 (Statistic) 표본의 특성을 나타내는 수치들 2. 확률적 표본 추출 방법 단순 무작위 추출 (Simple Random Sampling) 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출 계통 추출 (Systematic Sampling) 모집단 개체에 1, 2, .... , N 이라는 일련 번호를 부여하고 K개씩 n개의 구간으로 나눈 후 첫 구간에서 임의로 하나 선택 후 일정 간격(K) 으로 띄어서 표본 ..
[데이터 이해] 06. 데이터 사이언스 06. 데이터 사이언스 1. 데이터 사이언스의 의미 • 데이터 사이언스는 데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커 사고방식, 해당 분야의 전문 지식을 종합한 학문이다. • 정형, 반정형, 비정형의 다양한 데이터를 대상으로 하며 총체적 접근법을 사용한다. 2. 데이터 사이언스의 핵심 구성요소 IT (Data Managerment) • 시그널 프로세싱 • 프로그래밍 • 데이터 엔지니어링 • 데이터 웨어하우징 • 고성능 컴퓨팅 분석 • 수학 • 확률 모델 • 분석학 • 패턴인식과 학습 비즈니스 컨설팅 • 커뮤니케이션 • 프리젠테이션 • 스토리텡링 • 시각화 ◈ 다른 학문과의 차이점 데이터 사이언스 통계학 데이터 마이닝 분석 대상 정형, 반정형, 비정형 등 다양한 데이터 정형화된 데이터 분석 ..