빅데이터 10일차 - 머신러닝, 데이터 마이닝, 군집화, 분류,지도학습 비지도학습

2020. 8. 3. 12:56·데이터과학/R
목차
  1. 머신러닝의 등장
  2.  
  3. 데이터 마이닝과 머신러닝
  4.  
  5. 지도학습과 비지도학습
  6. 군집화와 분류의 개념
728x90

머신러닝의 등장

  • 머신러닝은 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술이다.
  • 머신러닝의 대표적 기술 중의 하나는 군집화(clusterig)와 분류(classification)

 

[그림1] 머신러닝 응용 분야

 

데이터 마이닝과 머신러닝

  • 데이터 마이닝(Data Mining) : 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법
  • 머신러닝(Machine Learning) : 방대한 데이터를 컴퓨터가 스스로 분석하고 학습하여 유용한 정보를 얻어내거나 미래를 예측하기 위한 예측모델을 만들어내는 기술

[그림2] 그림 출처 : https://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/

 

 

지도학습과 비지도학습

  • 지도학습(Supervised Data Prediction) : 의사결정나무(Decision Tree), 인공신경망(ANN), 일반화 선형 모형(GLM), 회귀분석(Regression Analysis), 로지스틱 회귀분석, 사례기반 추론, 최근접 이웃법(KNN)
  • 비지도학습(Unsupervised Data Prediction) : OLAP, 연관성 규칙발견, 군집분석, SOM

 

 

[그림3] 그림 출처 : https://ellun.tistory.com/103
[그림4] 그림 출처 : https://ellun.tistory.com/103
[그림5] 그림 출처 : https://ellun.tistory.com/103

 

 

군집화와 분류의 개념

  • 군집화(clustering) : 주어진 대상 데이터들을 유사성이 높은 것끼리 묶어주는 기술
  • 이러한 묶음을 군집 cluster, 범주 category, 그룹 group, class 등 다양한 용어로 부름
  • 분류(classification) : 그룹 group, class의 형태로 알려진 데이터들이 있을 때 그룹을 모르는 어떤 데이터에 대해 어느 그룹에 속하는지를 예측하는 기술

 

[그림6] 군집화와 분류, 그림 출처 : https://jjeongil.tistory.com/389

 

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
저작자표시 비영리 변경금지 (새창열림)
  1. 머신러닝의 등장
  2.  
  3. 데이터 마이닝과 머신러닝
  4.  
  5. 지도학습과 비지도학습
  6. 군집화와 분류의 개념
'데이터과학/R' 카테고리의 다른 글
  • 빅데이터11일차 - 대상 데이터 표준화 후 군집화
  • 빅데이터11일차 - k-평균 군집화
  • 빅데이터 10일차 - 이상값(Outlier)인식 방법, 극단값 절단 방법
  • 빅데이터 10일차 - 결측값 인식, 결측값 처리 방법
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      str lib
      k-평균 군집
      R 원 그래프
      자료의 종류
      확률
      시계열 모형
      R 원 그래프 퍼센트
      yolov10
      단순선형 회귀분석
      다차원 척보법
      주성분 분석(PCA)
      stylegan2
      Python Regular Expression Quick Guide
      상관분석
      통계량에 의한 자료 분석
      python 주요 데이터 타입
      Python 크롤링 기초
      확률 분포
      매핑형(딕셔너리)
      논문
      Coursera 1
      k-means clustering
      CV
      시퀀스형
      R 도수분포표
      Coursera Python Data Structures
      베르누이분포
      none타입
      지수분포
      yolov9
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    빅데이터 10일차 - 머신러닝, 데이터 마이닝, 군집화, 분류,지도학습 비지도학습

    개인정보

    • 티스토리 홈
    • 포럼
    • 로그인
    상단으로

    티스토리툴바

    단축키

    내 블로그

    내 블로그 - 관리자 홈 전환
    Q
    Q
    새 글 쓰기
    W
    W

    블로그 게시글

    글 수정 (권한 있는 경우)
    E
    E
    댓글 영역으로 이동
    C
    C

    모든 영역

    이 페이지의 URL 복사
    S
    S
    맨 위로 이동
    T
    T
    티스토리 홈 이동
    H
    H
    단축키 안내
    Shift + /
    ⇧ + /

    * 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.