728x90
반응형

데이터 분리

  • 하나의 데이터셋을 열의 값을 기준으로 여러 개의 데이터셋으로 분리할 때에는 split() 함수를 이용
# 데이터 분리
# sp <- split('분리할 데이터', '분리 조건')
sp <- split(iris, iris$Species) # 품종별로 데이터 분리
sp # 분리 결과
summary(sp) # 분리 결과 요약
sp$versicolor # versicolor 품종의 데이터 확인

[그림1] setosa 품종
[그림2] versicolor 품종
[그림3] virginica 품종
[그림4] 분리 결과 요약

 

[그림5] versicolor 특정 분리 데이터만 출력

 

 

데이터 선택

  • 데이터셋으로부터 조건에 맞는 행들을 추출할 때는 subset()함수를 이용
  • select매개변수는 추출할 열을 지정하는 역할
# 데이터 선택
# subset('데이터 이름', '조건')
subset(iris, Species =="versicolor") # versicolor만 추출
subset(iris, Sepal.Length >= 7.5) # Sepal.Length 7.5 이상만
subset(iris, Sepal.Length > 4.0 & Sepal.Length < 5.0) # 4.0 ~ 5.0까지만 출력
subset(iris, Sepal.Length > 7.6, select=c(Petal.Length,Petal.Width)) # 7.6이상, petal.Legnth,Petal.Width만 출력

[그림6] 데이터 선택, versicolor만
[그림7] Sepa.Length 7.5이상만 선택
[그림8] Sepal.Length 4.0~ 5.0
[그림9] iris 7.6이상, Petal.Length, Width만 출력

 

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기