728x90
반응형
통계적 추론1 – 점 추정과 구간 추정
- 모집단으로부터 표본을 추출하여 뽑은 표본을 가지고 모집단을 추론하는 것
① 점 추정(point estimation)
- 모수가 특정한 값일 것이라고 추정하는 것
- 예) 40대 여성의 평균 키는 160cm이다. (점 추정)
- 사실상 추정이 얼마나 정확한가를 판단하기가 불가능
② 구간 추정
- 점 추정의 정확성을 보완하는 방법
- 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것,
- 예) 40대 여성의 평균 키는 155cm ~165cm 사이이다.
- 일반적인 신뢰수준 : 90%, 95%, 99% 확률 이용
- 95% 신뢰수준이란 100번 표본을 추출하여 신뢰구간을 구하는 경우 100개의 구간 중에 95개 구간이 모수 를 포함한다는 뜻
* 40대 모두를 조사할 수는 없으니 표본으로 40대 100명을 뽑아서 가설검증을 한다.
* 100% 신뢰 수준을 보여주려면 구간을 넓게 잡으면 가능하다. 하지만 의미는 별로 없다. 예) 키 1m~3m
통계적 추론2 – 가설 검정
- 모집단에 대한 예상, 주장 또는 추측 등의 옳고 그름을 표본을 뽑아 통계적으로 판정하는 과정
① 가설 검정 절차
- 모집단에 대한 어떤 가설을 설정 → 표본 관찰 → 가설의 채택 여부 결정
② 가설의 종류
- 귀무가설(H0) : 지금까지 참이라고 생각되는 가설
- 대립가설(H1) : 귀무가설과 대립되는 가설, 표본을 통하여 입증하고자 하는 가설
- 예)우리나라 여성의 평균 몸무게는 59kg인 것으로 알려져 있다. 최근 다이어트에 대한 관심이 높아지면서 평 균 몸무게도 줄어든 것으로 주장하고 있다.
③ 검정통계량
- 귀무가설의 기각여부를 결정하는데 사용되는 통계량(표본 평균과 표본 분산 통계량 사용)
④ 유의수준( )
- 귀무가설을 기각하게 되는 확률로 ‘귀무가설이 옳은데도 이를 기각하는 확률의 크기‘
- 0.01, 0.05, 0.1 중 한 개의 값으로 보통 0.05를 사용
⑤ 기각역(C)
- 귀무가설이 기각되는 영역
⑥ 유의확률(p-value)
- 1종 오류가 일어날 실제 확률
- p값이 미리 정해진 유의수준(0.05)보다 작으면 귀무가설을 기각 - 대립가설 채택
출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU
728x90
반응형