728x90
반응형

통계적 추론1 – 점 추정과 구간 추정

 

  • 모집단으로부터 표본을 추출하여 뽑은 표본을 가지고 모집단을 추론하는 것


① 점 추정(point estimation)

  • 모수가 특정한 값일 것이라고 추정하는 것
  • 예) 40대 여성의 평균 키는 160cm이다. (점 추정)
  • 사실상 추정이 얼마나 정확한가를 판단하기가 불가능


② 구간 추정

  • 점 추정의 정확성을 보완하는 방법
  • 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것,
  • 예) 40대 여성의 평균 키는 155cm ~165cm 사이이다.
  • 일반적인 신뢰수준 : 90%, 95%, 99% 확률 이용
  • 95% 신뢰수준이란 100번 표본을 추출하여 신뢰구간을 구하는 경우 100개의 구간 중에 95개 구간이 모수 를 포함한다는 뜻 

[그림1] 추론의 과정

 

* 40대 모두를 조사할 수는 없으니 표본으로 40대 100명을 뽑아서 가설검증을 한다.

* 100% 신뢰 수준을 보여주려면 구간을 넓게 잡으면 가능하다. 하지만 의미는 별로 없다. 예) 키 1m~3m

 

통계적 추론2 – 가설 검정

  • 모집단에 대한 예상, 주장 또는 추측 등의 옳고 그름을 표본을 뽑아 통계적으로 판정하는 과정


① 가설 검정 절차

  • 모집단에 대한 어떤 가설을 설정 → 표본 관찰 → 가설의 채택 여부 결정

② 가설의 종류

  • 귀무가설(H0) : 지금까지 참이라고 생각되는 가설
  •  대립가설(H1) : 귀무가설과 대립되는 가설, 표본을 통하여 입증하고자 하는 가설
  • 예)우리나라 여성의 평균 몸무게는 59kg인 것으로 알려져 있다. 최근 다이어트에 대한 관심이 높아지면서 평 균 몸무게도 줄어든 것으로 주장하고 있다.

[그림2] 귀무가설, 대립가설(단측검정)

③ 검정통계량

  • 귀무가설의 기각여부를 결정하는데 사용되는 통계량(표본 평균과 표본 분산 통계량 사용)

④ 유의수준( ) 

  • 귀무가설을 기각하게 되는 확률로 ‘귀무가설이 옳은데도 이를 기각하는 확률의 크기‘
  • 0.01, 0.05, 0.1 중 한 개의 값으로 보통 0.05를 사용

⑤ 기각역(C)

  •  귀무가설이 기각되는 영역

⑥ 유의확률(p-value)

  • 1종 오류가 일어날 실제 확률
  • p값이 미리 정해진 유의수준(0.05)보다 작으면 귀무가설을 기각 - 대립가설 채택

 

 

출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기