728x90
확률 변수와 확률 분포
- 확률은 어떠한 사건이 일어날 가능성을 수로 표현
시행(Trial)
- 반복할 수 있으며, 매번 결과가 달라질 수 있는 실험
- 결과가 우연에 의해 결정되는 행위 또는 관찰을 의미
- 시행은 동일한 조건하에서 반복 가능해야 한다.
사건(Event)
- 시행에 따른 결과들의 집합을 의미
- 표본 공간(Sample Space)의 부분집합으로 표현
확률 변수(Random Variable)
- 시행의 결과, 사건에 따라 값이 확률적으로 결정되는 변수를 의미
- 표본 공간(Sample Space) : 발생 가능한 모든 사건들의 집합(전체 집합)
- 확률 변수는 표본 공간 안에서 특정 확률로 발생하는 사건을 특정한 수치에 대응시키는 함수
- 이때 확률 변수가 취할 수 있는 모든 값 $x$의 집합을 상태 공간(state space)라고 한다.
- 예시 : 주사위 두 개 던지기
- 주사위 두 개를 던지는 시행에서, 확률 변수 $X$ = "두 주사위 눈의 합"은 이산 확률 변수
- $X$ = {2,3,4,5,6,7,8,9,10,11,12} 중 하나의 값을 가진다.
- 예를 들어 첫 번째 주사위가 3, 두 번째 주사위가 5가 나오면 확률 변수 $X$는 값 $x$ = 8을 가진다.
- 이처럼 확률 변수 $X$는 대문자로 표기하고, 확률 변수가 취할 수 있는 값은 소문자 $x$로 표현
확률 함수(Probability Random)
- 확률 함수란, 확률 변수에 따라서 확률 값을 부여하는 함수를 말함
- 확률 함수는 일반적으로 $P$라고 표현
- 위 "주사위 두 개 던지기" 예시에서 눈금의 합이 8이 나올 확률은 5/36
- 눈금의 합이 8이 되는 경우로는 (2,6), (3,5), (4,4), (5,3), (6,2) 5가지 경우가 존재
- 이를 다음과 같이 표현
- $P(X = 3) = \frac{2}{36}$
확률 분포(Probability Distribution)
- 확률 변수가 취할 수 있는 모든 값과 그 값들의 확률을 대응시킨 관계를 의미
- 확률 분포는 확률 변수의 행동을 완전히 기술
- 이는 데이터의 패턴을 이해하고, 통계적 추론을 가능하게 한다.
확률 분포 함수(Probability Distribution Function)
- 확률변수 $X$가 가지는 값 $x$에 확률 $P(X = x)$을 대응시키는 함수를 의미
- 확률 분포 그 자체를 함수로 보고, 확률 분포 함수 $P$와 같은 의미로 쓰기도 한다.
- 대표적인 확률 분포 함수로는 확률질량함수, 확률밀도함수가 있다.
이산확률분포(Disicrete Probability Distribution)
- 유한하거나 셀 수 있는 모든 값들을 가진 경우, 이를 이산확률변수라고한다.
- 이때 이산확률분포는 이산확률변수의 확률 분포를 의미
연속확률분포(Continuous Probability Distribution)
- 실수 구간 내의 모든 값을 가진 경우, 이를 연속확률변수라고한다.
- 예 : 키, 달리기, 성적
- 사람의 키는 실수 값을 가지기 때문에, 값의 개수를 셀 수 없다.
- 키가 173.29124...일 확률이 얼마일까?
- 이러한 경우 키가 170cm 이상, 175cm 미만일 확률을 구하는 방식을 사용할 수 있다.
- 연속확률분포는 연속확률변수의 확률밀도를 기술한다.
AI에서의 활용
- 확률 변수와 확률 분포는 머신러닝과 AI의 이론적 기반을 형성하며, 예측, 추론, 모델링에 필수적
활용
- 분류 문제 : 이메일이 스팸일 확률을 계산하여 필터링
- 컴퓨터 비전 : 이미지에서 객체 인식 시 각 클래스에 속할 확률 계산
- 자연어 처리 : 다음 단어나 문장 생성 시 확률 분포에 기반한 예측
- 강화 학습 : 에이전트의 행동 선택 시 확률적 정책 사용
728x90