통계의 이해 - 통계적 추론, 가설 검정

2020. 7. 21. 02:38·데이터과학/ADSP
728x90

통계적 추론1 – 점 추정과 구간 추정

 

  • 모집단으로부터 표본을 추출하여 뽑은 표본을 가지고 모집단을 추론하는 것


① 점 추정(point estimation)

  • 모수가 특정한 값일 것이라고 추정하는 것
  • 예) 40대 여성의 평균 키는 160cm이다. (점 추정)
  • 사실상 추정이 얼마나 정확한가를 판단하기가 불가능


② 구간 추정

  • 점 추정의 정확성을 보완하는 방법
  • 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것,
  • 예) 40대 여성의 평균 키는 155cm ~165cm 사이이다.
  • 일반적인 신뢰수준 : 90%, 95%, 99% 확률 이용
  • 95% 신뢰수준이란 100번 표본을 추출하여 신뢰구간을 구하는 경우 100개의 구간 중에 95개 구간이 모수 를 포함한다는 뜻 

[그림1] 추론의 과정

 

* 40대 모두를 조사할 수는 없으니 표본으로 40대 100명을 뽑아서 가설검증을 한다.

* 100% 신뢰 수준을 보여주려면 구간을 넓게 잡으면 가능하다. 하지만 의미는 별로 없다. 예) 키 1m~3m

 

통계적 추론2 – 가설 검정

  • 모집단에 대한 예상, 주장 또는 추측 등의 옳고 그름을 표본을 뽑아 통계적으로 판정하는 과정


① 가설 검정 절차

  • 모집단에 대한 어떤 가설을 설정 → 표본 관찰 → 가설의 채택 여부 결정

② 가설의 종류

  • 귀무가설(H0) : 지금까지 참이라고 생각되는 가설
  •  대립가설(H1) : 귀무가설과 대립되는 가설, 표본을 통하여 입증하고자 하는 가설
  • 예)우리나라 여성의 평균 몸무게는 59kg인 것으로 알려져 있다. 최근 다이어트에 대한 관심이 높아지면서 평 균 몸무게도 줄어든 것으로 주장하고 있다.

[그림2] 귀무가설, 대립가설(단측검정)

③ 검정통계량

  • 귀무가설의 기각여부를 결정하는데 사용되는 통계량(표본 평균과 표본 분산 통계량 사용)

④ 유의수준( ) 

  • 귀무가설을 기각하게 되는 확률로 ‘귀무가설이 옳은데도 이를 기각하는 확률의 크기‘
  • 0.01, 0.05, 0.1 중 한 개의 값으로 보통 0.05를 사용

⑤ 기각역(C)

  •  귀무가설이 기각되는 영역

⑥ 유의확률(p-value)

  • 1종 오류가 일어날 실제 확률
  • p값이 미리 정해진 유의수준(0.05)보다 작으면 귀무가설을 기각 - 대립가설 채택

 

 

출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/ADSP' 카테고리의 다른 글
  • 통계적 이해 - 모집단의 모수에 대한 검정 방법
  • 통계적 이해 - 가설 검정에서의 오류
  • 통계의 이해 - 확률변수, 확률변수의 기댓값
  • 통계의 이해 - 통계적 분석 방법, 확률, 조건부 확률
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      확률
      다차원 척보법
      Python 크롤링 기초
      통계량에 의한 자료 분석
      Coursera 1
      python 주요 데이터 타입
      k-means clustering
      yolov9
      yolov10
      상관분석
      시퀀스형
      베르누이분포
      주성분 분석(PCA)
      R 원 그래프
      R 원 그래프 퍼센트
      Coursera Python Data Structures
      CV
      Python Regular Expression Quick Guide
      논문
      시계열 모형
      지수분포
      str lib
      stylegan2
      R 도수분포표
      단순선형 회귀분석
      매핑형(딕셔너리)
      확률 분포
      none타입
      k-평균 군집
      자료의 종류
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    통계의 이해 - 통계적 추론, 가설 검정
    상단으로

    티스토리툴바