확률 변수와 확률 분포

2025. 3. 12. 20:58·기초 수학/확률통계
728x90

확률 변수와 확률 분포

  • 확률은 어떠한 사건이 일어날 가능성을 수로 표현 

 

시행(Trial)

  • 반복할 수 있으며, 매번 결과가 달라질 수 있는 실험 
  • 결과가 우연에 의해 결정되는 행위 또는 관찰을 의미
  • 시행은 동일한 조건하에서 반복 가능해야 한다. 

사건(Event)

  • 시행에 따른 결과들의 집합을 의미 
  • 표본 공간(Sample Space)의 부분집합으로 표현 

 

확률 변수(Random Variable)

  • 시행의 결과, 사건에 따라 값이 확률적으로 결정되는 변수를 의미
  • 표본 공간(Sample Space) : 발생 가능한 모든 사건들의 집합(전체 집합)
  • 확률 변수는 표본 공간 안에서 특정 확률로 발생하는 사건을 특정한 수치에 대응시키는 함수
  • 이때 확률 변수가 취할 수 있는 모든 값 $x$의 집합을 상태 공간(state space)라고 한다.
  • 예시 : 주사위 두 개 던지기 
    • 주사위 두 개를 던지는 시행에서, 확률 변수 $X$ = "두 주사위 눈의 합"은 이산 확률 변수
    • $X$ = {2,3,4,5,6,7,8,9,10,11,12} 중 하나의 값을 가진다.
    • 예를 들어 첫 번째 주사위가 3, 두 번째 주사위가 5가 나오면 확률 변수 $X$는 값 $x$ = 8을 가진다.
    • 이처럼 확률 변수 $X$는 대문자로 표기하고, 확률 변수가 취할 수 있는 값은 소문자 $x$로 표현 

확률 함수(Probability Random)

  • 확률 함수란, 확률 변수에 따라서 확률 값을 부여하는 함수를 말함
  • 확률 함수는 일반적으로 $P$라고 표현 
  • 위 "주사위 두 개 던지기" 예시에서 눈금의 합이 8이 나올 확률은 5/36
    • 눈금의 합이 8이 되는 경우로는 (2,6), (3,5), (4,4), (5,3), (6,2) 5가지 경우가 존재
    • 이를 다음과 같이 표현
    • $P(X = 3) = \frac{2}{36}$

확률 분포(Probability Distribution)

  • 확률 변수가 취할 수 있는 모든 값과 그 값들의 확률을 대응시킨 관계를 의미 
  • 확률 분포는 확률 변수의 행동을 완전히 기술
  • 이는 데이터의 패턴을 이해하고, 통계적 추론을 가능하게 한다. 

[그림 1] 확률 분포 출처 : https://ko.wikipedia.org/wiki/%ED%99%95%EB%A5%A0_%EB%B6%84%ED%8F%AC

 

확률 분포 함수(Probability Distribution Function)

  • 확률변수 $X$가 가지는 값 $x$에 확률 $P(X = x)$을 대응시키는 함수를 의미
  • 확률 분포 그 자체를 함수로 보고, 확률 분포 함수 $P$와 같은 의미로 쓰기도 한다.
  • 대표적인 확률 분포 함수로는 확률질량함수, 확률밀도함수가 있다.

이산확률분포(Disicrete Probability Distribution)

  • 유한하거나 셀 수 있는 모든 값들을 가진 경우,  이를 이산확률변수라고한다.
  • 이때 이산확률분포는 이산확률변수의 확률 분포를 의미

연속확률분포(Continuous Probability Distribution)

  • 실수 구간 내의 모든 값을 가진 경우, 이를 연속확률변수라고한다.
  •  예 : 키, 달리기, 성적 
    • 사람의 키는 실수 값을 가지기 때문에, 값의 개수를 셀 수 없다.
    • 키가 173.29124...일 확률이 얼마일까?
    • 이러한 경우 키가 170cm 이상, 175cm 미만일 확률을 구하는 방식을 사용할 수 있다.
  • 연속확률분포는 연속확률변수의 확률밀도를 기술한다.

 

AI에서의 활용

  • 확률 변수와 확률 분포는 머신러닝과 AI의 이론적 기반을 형성하며, 예측, 추론, 모델링에 필수적

 

활용

  • 분류 문제 : 이메일이 스팸일 확률을 계산하여 필터링
  • 컴퓨터 비전 : 이미지에서 객체 인식 시 각 클래스에 속할 확률 계산
  • 자연어 처리 : 다음 단어나 문장 생성 시 확률 분포에 기반한 예측 
  • 강화 학습 : 에이전트의 행동 선택 시 확률적 정책 사용 
728x90
저작자표시 비영리 변경금지 (새창열림)
'기초 수학/확률통계' 카테고리의 다른 글
  • 연속확률분포
  • 이산확률분포
  • 확률개요
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      R 원 그래프 퍼센트
      none타입
      python 주요 데이터 타입
      논문
      통계량에 의한 자료 분석
      시퀀스형
      베르누이분포
      상관분석
      시계열 모형
      주성분 분석(PCA)
      지수분포
      k-means clustering
      R 원 그래프
      단순선형 회귀분석
      다차원 척보법
      CV
      str lib
      자료의 종류
      yolov10
      R 도수분포표
      Coursera 1
      확률
      매핑형(딕셔너리)
      Python 크롤링 기초
      Python Regular Expression Quick Guide
      stylegan2
      yolov9
      확률 분포
      k-평균 군집
      Coursera Python Data Structures
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    확률 변수와 확률 분포
    상단으로

    티스토리툴바