728x90
반응형
표본 공간(sample space)
- 샘플 x가 가질 수 있는 모든 값의 집합
확률 밀도 함수(probability density function)
- p(x)는 표본 공간의 포인트 x를 0과 1사이의 숫자에 매핑하는 함수다.
- 표본 공간의 모든 포인트에 대한 확률 밀도 함수의 합은 1이 되어야 잘 정의된 확률 ㅂ누포다.
모수 모델(parametric model)
- 적합한 Pmodel(X)를 차지 위해 사용하는 기법
- P0(x)는 한정된 개수의 파라미터 0을 사용하여 묘사하는 확률 밀도 함수의 한 종류다.
가능도(likelihood)
- 파라미터 집합 0의 가능도 £(0|x)는 샘플 포인트 x가 주어졌을 때 0의 알맞은 정도를 측정하는 함수다.
최대 가능도 추정(maximum likelihood estimation)
- 모수 모델이 데이터셋 X가 관측될 가능도를 최대화하는 파라미터 0hat의 최적값을 찾는 기법
- 확률 밀도 함수 P0(x)의 파라미터 집합 0에서 관측된 데이터 X를 가장 잘 설명할 수 있는 추정값 0hat을 찾는 방법
첫 번째 확률적 생성 모델
- 로들 데이터셋
- N = 50개 패션 샘플
- 5개의 특성(accessoriesType, clothingColor, clothingType, hairColor, topType)으로 설명 가능
- 각 특성
- 7가지 머리 모양
- 6가지 머리 색깔
- 3가지 안경
- 4가지 옷
- 8가지 옷 색깔
- 7 x 6 x 3 x 4 x 8 = 4,032개의 특성 조합 = 4,032개의 포인트
나이브 베이즈(Naive Bayes)
- 간단한 가정을 사용해 추정할 파라미터의 개수를 크게 줄여준다.
- 데이터로부터 어떤 구조를 학습하고 이를 사용해 워본 데이터셋에 없는 새로운 샘플을 생성 가능하다.
- 이 모델은 각 특성값의 발견 확률을 독립적으로 추정한다.
http://www.yes24.com/Product/Goods/81538614?OzSrank=1
728x90
반응형
최근댓글