통계의 이해 - 통계, 표본 추출 방법, 자료의 종류, 데이터 척도의 구분

2020. 7. 20. 01:32·데이터과학/ADSP
728x90

통계

  • 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현
  • 통계 자료의 획득 방법 : 총 조사(전수 조사), 표본조사
  • 모집단(population) : 관심의 대상이 되는 모든 개체의 집합
  • 표본(sample) : 모집단에서 실제로 뽑은 개체의 집합
  • 모수(parameter) : 모집단에 대한 정보

[그림1] 모집단과 표본

 

예) 대학생의 음주율를 조사한다면

모집단 = 대학생 전체

표본 = 대학생 남녀 100명 - 대학생 전체를 조사하기는 매우 힘드니 표본을 대상으로 조사

모수 = 모집단은 모두 몇 명인지, 표준편차 등등 

 

표본 추출 방법(4가지)

① 단순랜덤추출법(simple random sampling)

  • N개의 원소로 구성된 모집단에서 n개의 표본을 추출할 때 각 원소에 1, 2, 3,..., N까지의 번호를 부여, n개의
    번호를 임의로 선택해 그 번호에 해당하는 원소를 표본 추출(복원/비복원 방법)

② 계통추출법(systematic sampling)

  • 모집단의 모든 원소들에게 1, 2, 3, ..., N의 일련번호를 부여하고 이를 순서대로 나열한 후에 K개(K=N/n)씩
    n개의 구간으로 나눈다. 첫 구간(1, 2, 3, ..., K)에서 하나의 임의로 선택한 후 K개씩 띄어서 표본을 추출한다.

③ 집락추출법(cluster sampling)

  • 모집단이 몇 개의 집락(cluster)이 결합된 형태로 구성돼 있고, 각 집단에서 원소들에게 일련번호를 부여할 수
    있는 경우에 이용된다.
    일부 집락을 랜덤으로 선택하고 선택된 각 집락에서 표본을 임의로 선택한다.

④ 층화추출법(stratified sampling)

  • 상당히 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법. 이질적
    인 모집단의 원소들을 서로 유사한 것끼리 몇 개의 층(stratum)으로 나눈 후, 각 층에서 표본을 랜덤 하게 추
    출한다.

 

*모집단의 개수는 대문자 N 표본의 개수는 소문자 n으로 일반적으로 표기한다.

 

[그림2] 단순랜덤추출법
[그림3]  계통추출법
[그림4] 집략추출법
[그림5] 층화추출법

 

 

자료의 종류(측정 방법) 4가지

[그림6] 자료의 종류

데이터 척도의 구분

 

[그림7] 데이터 척도의 구분

 

 

출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/ADSP' 카테고리의 다른 글
  • 통계의 이해 - 확률변수, 확률변수의 기댓값
  • 통계의 이해 - 통계적 분석 방법, 확률, 조건부 확률
  • 빅데이터 3일차 - 자료의 종류, 단일 변수와 다중 변수
  • 빅데이터 1일차 - 1과목 데이터 이해
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      확률 분포
      k-평균 군집
      str lib
      통계량에 의한 자료 분석
      시계열 모형
      python 주요 데이터 타입
      yolov9
      상관분석
      k-means clustering
      매핑형(딕셔너리)
      none타입
      주성분 분석(PCA)
      Coursera 1
      stylegan2
      R 원 그래프
      R 원 그래프 퍼센트
      논문
      베르누이분포
      Python 크롤링 기초
      다차원 척보법
      확률
      자료의 종류
      Coursera Python Data Structures
      시퀀스형
      CV
      지수분포
      R 도수분포표
      yolov10
      단순선형 회귀분석
      Python Regular Expression Quick Guide
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    통계의 이해 - 통계, 표본 추출 방법, 자료의 종류, 데이터 척도의 구분
    상단으로

    티스토리툴바