빅데이터 4일차 - 사분위수

2020. 7. 17. 11:09·데이터과학/R
728x90

사분위수

  • 사분위수(quatile)란 주어진 자료에 있는 값들을 크기순으로 나열했을 때 이것을 4등분하는 지점에 있는 값들을 의미한다.
  • 자료에 있는 값들을 4등분하면 등분점이 3개 생기는데, 앞에서부터 '제1사분위수(Q1)',' 제2사분위수(Q2)', '제3사분위수(Q3)'라고 부르며, 제 2사분위수(Q2)는 중앙값과 동일하다.
  • 전체 자료를 4개로 나누었기 때문에 4개의 구간에는 각각 25%의 자료가 존재한다.

[그림1] 사분위수 

더보기
mydata <- c(60,62,64,65,68,69,120) # mydata에 7개의 값을 넣는다. 
quantile(mydata) # 기본 25% 
quantile(mydata,(0:10)/10) # 10% 단위로 구간을 나누어 계산
quantile(mydata,(0:20)/20) # 5% 단위로 구간을 나누어 계산
quantile(mydata,(0:5)/5) # 20%  단위로 구간을 나누어 계산
summary(mydata) # 사분위수를 사용할 때에는 summary를 많이 사용한다. 
# 이유는 summary(1st Qu, medain, 3rd Qu, 최대값, 최솟값, 평균)을 함께 출력하기 때문이다.

[그림2] 사분위수 예제 출력

(0:10)/10의 의미는 0~10의 정수를 10으로 나누라는 것이고, 결과는 0.1~1.0까지의 값이 되는데 이것을 백분율로 환산하면 10%~100%가 된다. 그렇기 때문에 앞의 결과와 같이 10% 단위로 구간을 나누어 결과값이 출력된다.

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/R' 카테고리의 다른 글
  • 빅데이터 4일차 - 히스토그램
  • 빅데이터 4일차 - 산포
  • 빅데이터 4일차 - 숫자로 된 범주형 자료, R 색상
  • 빅데이터 4일차 - R 평균과 중앙값
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      주성분 분석(PCA)
      k-means clustering
      Python 크롤링 기초
      yolov9
      다차원 척보법
      시퀀스형
      자료의 종류
      yolov10
      R 원 그래프
      Coursera 1
      stylegan2
      논문
      통계량에 의한 자료 분석
      none타입
      매핑형(딕셔너리)
      R 원 그래프 퍼센트
      베르누이분포
      Coursera Python Data Structures
      확률
      단순선형 회귀분석
      k-평균 군집
      str lib
      CV
      상관분석
      시계열 모형
      R 도수분포표
      Python Regular Expression Quick Guide
      지수분포
      확률 분포
      python 주요 데이터 타입
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    빅데이터 4일차 - 사분위수
    상단으로

    티스토리툴바