728x90
반응형
머신러닝(Machine Learning)
- 일반적으로 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법
- 데이터를 기반으로 통계적인 신뢰도를 강화하고 예측 오류를 최소화하기 위한 다양한 수학적 기법을 적용해 데이터 내의 패턴을 스스로 인지하고 신뢰도 있는 예측 결과를 도출해 낸다.
- 데이터를 관통하는 패턴을 핛브하고, 이에 기반한 예측을 수행하면서 데이터 분석 영역에 새로운 혁신을 가져왔다.
- 데이터 분석 영역은 재빠르게 머신러닝 기반의 예측 분석(Predictive Analysis)으로 재편되고 있다.
머신러닝의 분류
- 일반적으로 머신러닝은 지도학습(Supervised Learning)과 비지도학습(Un-Supervised Learning), 강화학습(Reinforcement Learning)으로 나뉜다.
지도학습
- 분류
- 회귀
- 추천 시스템
- 시각/음성 감지/인지
- 텍스트 분석, NLP
비지도학습
- 클러스터링
- 차원 축소
- 강화학습
데이터 전쟁
- 머신러닝의 가장 큰 단점은 데이터에 매우 의존적이라는 것이다.
- 가비지 인(Garbage In), 가비지 아웃(Garbage out), 즉 좋은 품질의 데이터를 갖추지 못한다면 머신러닝의 수행 결과도 좋을 수 없다.
- 최적의 머신러닝 알고리즘과 모델 파라미터를 구축하는 능력도 중요하지만 데이터를 이해하고 효율적으로 가공, 처리, 수출해 최적의 데이터를 기반으로 알고리즘을 구동할 수 있도록 준비하는 능력이 더 중요할 수 있다.
파이썬, R 머신러닝 비교
- R은 통계 전용 프로그램 언어
- R은 오랜 기간 사용자들이 생성하고 검증해온 다양하고 많은 통계 패키지를 보유하고 있는 것이 큰 장점이다.
- 파이썬은 다양한 영역에서 사용되는 개발 전문 프로그램 언어
- 파이썬은 직관적인 문법과 객체지향과 함수형 프로그래밍 모두를 포괄하는 유연한 프로그램 아키텍처, 다양한 라이브러리 등의 강점을 가지는 언어다.
출처 : http://www.yes24.com/Product/Goods/87044746
728x90
반응형
최근댓글