728x90
반응형

산포

  • 산포(distribution)란 주어진 자료에 있는 값들이 퍼져 있는 정도(흩어져 있는 정도)를 의미한다.
  • 산포는 수학시간에 배운 분산(variance)과 표준편차(standard deviation)를 가지고 파악
  • 분산 : 그림1
  • 표준편차 : 그림2
  • 자료의 분산과 표준편차가 작다는 의미는 자료의 관측값들이 평균값 부근에 모여 있다는 뜻

 

[그림1] 분산 식
[그림2] 표준편차 식

더보기
mydata <- c(60,62,64,65,68,69,120)
var(myadata) # 분산산
sd(mydata) # 표준편차
range(mydata) # 값의 범위
diff(range(mydata)) # 최댓값, 최솟값의 차이

[그림3] 산포 예제 출력 

* var() 함수는 분산을, sd()함수는 표준편차를 계산하는 함수다.

* range()함수는 자료의 관측값들이 어떤 범위에 있는지를 보여주는 함수로, 최솟값과 최댓값을 출력한다.

* diff() 함수는 두 값 사이의 차이를 알려주는 함수다. range(mydata)는 최솟값 60과 최댓값 120이므로 두 값 사이의 차이를 알려주면 60이 나온다. 

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기