728x90
반응형

자료의 종류

[그림1] 자료의 종류

단일 변수와 다중 변수

  • 통계학에서의 변수는 우리가 '연구, 조사, 관찰하고 싶은 대상의 특성'을 말하며, 키, 몸무게, 혈액형, 매출액, 습도, 미세먼지 농도 등등이 있다.
  • 단일변수 자료(univariate data) : 하나의 변수로만 구성된 자료, '일변량 자료'라고도 부른다.
  • 다중변수 자료(multivariate data) : 두 개 이상의 변수로 구성된 자료, 다변량 자료라고 부름. 특별히 두 개의 변수로 구성된 자료를 이변량 자료(bivariate data)라고 한다.

 

단일 변수 범주형 자료의 탐색

  • 단일 변수 범주형 자료(또는 일변량 질적 자료) : 특성이 하나이면서 자료의 특성이 범주형인 자료
  • 범주형 자료에 대해서 할 수 있는 기본적인 작업은 자료에 포함된 관측값들의 종류별로 개수를 세는 것이다.
  • 개수를 세면 종류별 비율을 알 수 있다.
  • 막대그래프나 원그래프의 작성이 가능하다.
  • 단일 변수 범주형 자료의 예 : 학생들이 선호하는 계절

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기