728x90
반응형
산포
- 산포(distribution)란 주어진 자료에 있는 값들이 퍼져 있는 정도(흩어져 있는 정도)를 의미한다.
- 산포는 수학시간에 배운 분산(variance)과 표준편차(standard deviation)를 가지고 파악
- 분산 : 그림1
- 표준편차 : 그림2
- 자료의 분산과 표준편차가 작다는 의미는 자료의 관측값들이 평균값 부근에 모여 있다는 뜻
더보기
mydata <- c(60,62,64,65,68,69,120)
var(myadata) # 분산산
sd(mydata) # 표준편차
range(mydata) # 값의 범위
diff(range(mydata)) # 최댓값, 최솟값의 차이
* var() 함수는 분산을, sd()함수는 표준편차를 계산하는 함수다.
* range()함수는 자료의 관측값들이 어떤 범위에 있는지를 보여주는 함수로, 최솟값과 최댓값을 출력한다.
* diff() 함수는 두 값 사이의 차이를 알려주는 함수다. range(mydata)는 최솟값 60과 최댓값 120이므로 두 값 사이의 차이를 알려주면 60이 나온다.
출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미
728x90
반응형