728x90
반응형

머신러닝의 등장

  • 머신러닝은 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술이다.
  • 머신러닝의 대표적 기술 중의 하나는 군집화(clusterig)와 분류(classification)

 

[그림1] 머신러닝 응용 분야

 

데이터 마이닝과 머신러닝

  • 데이터 마이닝(Data Mining) : 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법
  • 머신러닝(Machine Learning) : 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술

[그림2] 그림 출처 : https://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/

 

 

지도학습과 비지도학습

  • 지도학습(Supervised Data Prediction) : 의사결정나무(Decision Tree), 인공신경망(ANN), 일반화 선형 모형(GLM), 회귀분석(Regression Analysis), 로지스틱 회귀분석, 사례기반 추론, 최근접 이웃법(KNN)
  • 비지도학습(Unsupervised Data Prediction) : OLAP, 연관성 규칙발견, 군집분석, SOM

 

 

[그림3] 그림 출처 : https://ellun.tistory.com/103
[그림4] 그림 출처 : https://ellun.tistory.com/103
[그림5] 그림 출처 : https://ellun.tistory.com/103

 

 

군집화와 분류의 개념

  • 군집화(clustering) : 주어진 대상 데이터들을 유사성이 높은 것끼리 묶어주는 기술
  • 이러한 묶음을 군집 cluster, 범주 category, 그룹 group, class 등 다양한 용어로 부름
  • 분류(classification) : 그룹 group, class의 형태로 알려진 데이터들이 있을 때 그룹을 모르는 어떤 데이터에 대해 어느 그룹에 속하는지를 예측하는 기술

 

[그림6] 군집화와 분류, 그림 출처 : https://jjeongil.tistory.com/389

 

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기