728x90
반응형

사분위수

  • 사분위수(quatile)란 주어진 자료에 있는 값들을 크기순으로 나열했을 때 이것을 4등분하는 지점에 있는 값들을 의미한다.
  • 자료에 있는 값들을 4등분하면 등분점이 3개 생기는데, 앞에서부터 '제1사분위수(Q1)',' 제2사분위수(Q2)', '제3사분위수(Q3)'라고 부르며, 제 2사분위수(Q2)는 중앙값과 동일하다.
  • 전체 자료를 4개로 나누었기 때문에 4개의 구간에는 각각 25%의 자료가 존재한다.

[그림1] 사분위수 

더보기
mydata <- c(60,62,64,65,68,69,120) # mydata에 7개의 값을 넣는다. 
quantile(mydata) # 기본 25% 
quantile(mydata,(0:10)/10) # 10% 단위로 구간을 나누어 계산
quantile(mydata,(0:20)/20) # 5% 단위로 구간을 나누어 계산
quantile(mydata,(0:5)/5) # 20%  단위로 구간을 나누어 계산
summary(mydata) # 사분위수를 사용할 때에는 summary를 많이 사용한다. 
# 이유는 summary(1st Qu, medain, 3rd Qu, 최대값, 최솟값, 평균)을 함께 출력하기 때문이다.

[그림2] 사분위수 예제 출력

(0:10)/10의 의미는 0~10의 정수를 10으로 나누라는 것이고, 결과는 0.1~1.0까지의 값이 되는데 이것을 백분율로 환산하면 10%~100%가 된다. 그렇기 때문에 앞의 결과와 같이 10% 단위로 구간을 나누어 결과값이 출력된다.

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기