빅데이터 10일차 - 머신러닝, 데이터 마이닝, 군집화, 분류,지도학습 비지도학습

2020. 8. 3. 12:56·데이터과학/R
목차
  1. 머신러닝의 등장
  2.  
  3. 데이터 마이닝과 머신러닝
  4.  
  5. 지도학습과 비지도학습
  6. 군집화와 분류의 개념
728x90

머신러닝의 등장

  • 머신러닝은 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술이다.
  • 머신러닝의 대표적 기술 중의 하나는 군집화(clusterig)와 분류(classification)

 

[그림1] 머신러닝 응용 분야

 

데이터 마이닝과 머신러닝

  • 데이터 마이닝(Data Mining) : 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법
  • 머신러닝(Machine Learning) : 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술

[그림2] 그림 출처 : https://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/

 

 

지도학습과 비지도학습

  • 지도학습(Supervised Data Prediction) : 의사결정나무(Decision Tree), 인공신경망(ANN), 일반화 선형 모형(GLM), 회귀분석(Regression Analysis), 로지스틱 회귀분석, 사례기반 추론, 최근접 이웃법(KNN)
  • 비지도학습(Unsupervised Data Prediction) : OLAP, 연관성 규칙발견, 군집분석, SOM

 

 

[그림3] 그림 출처 : https://ellun.tistory.com/103
[그림4] 그림 출처 : https://ellun.tistory.com/103
[그림5] 그림 출처 : https://ellun.tistory.com/103

 

 

군집화와 분류의 개념

  • 군집화(clustering) : 주어진 대상 데이터들을 유사성이 높은 것끼리 묶어주는 기술
  • 이러한 묶음을 군집 cluster, 범주 category, 그룹 group, class 등 다양한 용어로 부름
  • 분류(classification) : 그룹 group, class의 형태로 알려진 데이터들이 있을 때 그룹을 모르는 어떤 데이터에 대해 어느 그룹에 속하는지를 예측하는 기술

 

[그림6] 군집화와 분류, 그림 출처 : https://jjeongil.tistory.com/389

 

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
저작자표시 비영리 변경금지 (새창열림)
  1. 머신러닝의 등장
  2.  
  3. 데이터 마이닝과 머신러닝
  4.  
  5. 지도학습과 비지도학습
  6. 군집화와 분류의 개념
'데이터과학/R' 카테고리의 다른 글
  • 빅데이터11일차 - 대상 데이터 표준화 후 군집화
  • 빅데이터11일차 - k-평균 군집화
  • 빅데이터 10일차 - 이상값(Outlier)인식 방법, 극단값 절단 방법
  • 빅데이터 10일차 - 결측값 인식, 결측값 처리 방법
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      베르누이분포
      Python 크롤링 기초
      Coursera Python Data Structures
      단순선형 회귀분석
      R 도수분포표
      k-means clustering
      k-평균 군집
      논문
      yolov10
      시퀀스형
      다차원 척보법
      매핑형(딕셔너리)
      지수분포
      yolov9
      상관분석
      자료의 종류
      R 원 그래프 퍼센트
      CV
      확률
      stylegan2
      Coursera 1
      str lib
      주성분 분석(PCA)
      시계열 모형
      통계량에 의한 자료 분석
      확률 분포
      none타입
      R 원 그래프
      Python Regular Expression Quick Guide
      python 주요 데이터 타입
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    빅데이터 10일차 - 머신러닝, 데이터 마이닝, 군집화, 분류,지도학습 비지도학습

    개인정보

    • 티스토리 홈
    • 포럼
    • 로그인
    상단으로

    티스토리툴바

    단축키

    내 블로그

    내 블로그 - 관리자 홈 전환
    Q
    Q
    새 글 쓰기
    W
    W

    블로그 게시글

    글 수정 (권한 있는 경우)
    E
    E
    댓글 영역으로 이동
    C
    C

    모든 영역

    이 페이지의 URL 복사
    S
    S
    맨 위로 이동
    T
    T
    티스토리 홈 이동
    H
    H
    단축키 안내
    Shift + /
    ⇧ + /

    * 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.