728x90
반응형

지도 학습 시스템의 주요 개념을 6개로 나눌 수 있다.

 

샘플

  • 예측에 사용하는 아이템
  • x로 표시
  • 입력(input)이라고 부른다.

 

타깃

  • 샘플에 상응하는 레이블
  • 예측되는 대상 
  • 표준적인 표기법에 따라 y로 나타낸다.
  • 정답(ground truth)라고 부른다.

 

모델

  • 수학식이나 샘플 x를 받아 타깃 레이블 값을 예측하는 함수

 

파라미터

  • 가중치(weight)
  • 모델을 규정한다.
  • w 로 나타냄

 

예측

  • 모델이 추측하는 타깃 값
  • 추정(estimate)이라고도 부른다.
  • '햇(hat)' 표기를 사용해 나타낸다
  • 타깃 y의 예측 = y^으로 표기

 

손실 함수

  • 훈련 데이터에 대한 예측이 타깃과 얼마나 멀리 떨어져 있는지 비교하는 함수
  • 손실이 낮을수록 타깃 예측을 더 잘하는 모델
  • 손실 함수는 L로 표기

 

(확률적) 경사 하강법을 사용한 훈련

  • 지도 학습의 목적은 주어진 데이터셋에서 손실 함수를 최소화하는 파라미터 값을 고르는 것이다.
  • 경사 하강법(gradient descent)은 식의 근을 찾는 일반적인 방법이다.
  • 전통적 확률 경사 하강법에서는 근(파라미터)의 초깃값을 추측한 다음 목적 함수(objective function)(손실 함수)의 값이 수용할만한 임계점 아래로 내려갈 때까지 반복해 업데이트한다. - 데이터 크기에 따라 메모리 제약
  • 확률적 경사 하강법(stochastic gradient descent(SGD)는 데이터 포인트를 하나 또는 일부 랜덤 하게 선택해 그레디언트를 계산한다.
  • 파라미터를 연속적으로 업데이트하는 과정을 역전파(backpropagation)라고 부른다.
  • 역전파의 각  단계(또는 에포크 epoch)는 정방향 계산(forward pass)과 역방향 계산(backward pass)으로 구성된다.
  • 정방향 계산은 현재 파라미터 값으로 입력을 평가해 손실 함수를 계산한다.
  • 역방향 계산은 손실의 그레이디언트를 사용해 파라미터를 업데이트한다.

 

 

 

 

 

 

 

 

http://www.yes24.com/Product/Goods/101874047?OzSrank=1 

 

파이토치로 배우는 자연어 처리 - YES24

쉽고 빠르게 익히는 자연어 처리 입문 가이드북자연어 처리(NLP)는 인공지능이 지닌 무한한 능력을 이용해 애플 시리, 아마존 알렉사, 구글 번역 등과 같은 제품을 탄생시켰다. 복잡하고 어렵게

www.yes24.com

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기