통계의 이해 - 통계적 분석 방법, 확률, 조건부 확률

2020. 7. 20. 02:01·데이터과학/ADSP
728x90

통계적 분석 방법


① 기술 통계(descriptive statistic)

  •  수집된 자료를 정리·요약하기 위해 사용되는 기초통계
  •  숫자로 표현하는 방식 : 평균, 표준편차, 중위수, 최빈값, % 
  •  그림으로 표현하는 방식 : 막대그래프, 원그래프, 꺽은선그래프 
  •  기술 통계 자체로도 여러 용도에 쓰이나 대개 자세한 통계적 분석을 위한 전 단계 역할


② 추론 통계(추측 통계) : 추정, 가설검정(hypothesis test), 예측(forecasting)

[그림1] 통계적 분석 방법

* 추정은 모수를 추정하는데 사용, 모수는 - 모집단의 특성 

 

확률

  •  특정 사건이 일어날 가능성의 척도
  •  표본 공간(sample space, Ω) : 나타날 수 있는 모든 결과들의 집합 
  •  원소(element) : 나타날 수 있는 개개의 결과
  •  사건(event) : 표본 공간의 부분집합

 


조건부 확률(conditional probability)

  • 사건 A가 일어났다는 가정 하의 사건 B의 확률
  • 사건 A가 주어졌을 때 조건부 확률 P(B|A)

P(B|A) = P(A∩B)/P(A), P(A) > 0

  • 두 사건 A, B가 서로 독립이면,

P(A∩B) = P(A)P(B)

 

예제) 교실 안에 7명의 학생이 있다. 학생 구성은 얼굴이 빨간 학생 과 파란 학생, 여학생(긴 머리)과 남학생(짧은 머리)이 있다. 한 명의 학생을 뽑을 때, 다음 확률을 구하여라. 단, 각각의 사건을 다음과 같이 정한다. R : 빨간 학생이 뽑히는 사건 B : 파란 학생이 뽑히는 사건 M : 남학생이 뽑히는 사건 F : 여학생이 뽑히는 사건 (1)P(R) (2)P(B) (3) P(R|M) (4) P(B|F)예제) 교실 안에 7명의 학생이 있다.
학생 구성은 얼굴이 빨간 학생 과 파란 학생,
여학생(긴 머리)과 남학생(짧은 머리)이 있다.
한 명의 학생을 뽑을 때, 다음 확률을 구하여라.
단, 각각의 사건을 다음과 같이 정한다.

 


R : 빨간 학생이 뽑히는 사건
B : 파란 학생이 뽑히는 사건
M : 남학생이 뽑히는 사건
F : 여학생이 뽑히는 사건

 

출처 : https://m.blog.naver.com/PostList.nhn?blogId=cbmathkor

정답 

(1)P(R)  =  7분의3
(2)P(B)  =  7분의4
(3) P(R|M) = 3분의2
(4) P(B|F) = 4분의3 

 

[그림3] 3번 조건부 식

 

 

출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/ADSP' 카테고리의 다른 글
  • 통계의 이해 - 통계적 추론, 가설 검정
  • 통계의 이해 - 확률변수, 확률변수의 기댓값
  • 통계의 이해 - 통계, 표본 추출 방법, 자료의 종류, 데이터 척도의 구분
  • 빅데이터 3일차 - 자료의 종류, 단일 변수와 다중 변수
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      R 도수분포표
      R 원 그래프 퍼센트
      매핑형(딕셔너리)
      R 원 그래프
      시퀀스형
      통계량에 의한 자료 분석
      yolov9
      다차원 척보법
      python 주요 데이터 타입
      k-평균 군집
      CV
      단순선형 회귀분석
      베르누이분포
      stylegan2
      k-means clustering
      확률
      Coursera Python Data Structures
      yolov10
      상관분석
      지수분포
      자료의 종류
      Python Regular Expression Quick Guide
      Python 크롤링 기초
      확률 분포
      str lib
      none타입
      Coursera 1
      논문
      주성분 분석(PCA)
      시계열 모형
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    통계의 이해 - 통계적 분석 방법, 확률, 조건부 확률
    상단으로

    티스토리툴바