728x90
반응형
데이터 분리
- 하나의 데이터셋을 열의 값을 기준으로 여러 개의 데이터셋으로 분리할 때에는 split() 함수를 이용
# 데이터 분리
# sp <- split('분리할 데이터', '분리 조건')
sp <- split(iris, iris$Species) # 품종별로 데이터 분리
sp # 분리 결과
summary(sp) # 분리 결과 요약
sp$versicolor # versicolor 품종의 데이터 확인
데이터 선택
- 데이터셋으로부터 조건에 맞는 행들을 추출할 때는 subset()함수를 이용
- select매개변수는 추출할 열을 지정하는 역할
# 데이터 선택
# subset('데이터 이름', '조건')
subset(iris, Species =="versicolor") # versicolor만 추출
subset(iris, Sepal.Length >= 7.5) # Sepal.Length 7.5 이상만
subset(iris, Sepal.Length > 4.0 & Sepal.Length < 5.0) # 4.0 ~ 5.0까지만 출력
subset(iris, Sepal.Length > 7.6, select=c(Petal.Length,Petal.Width)) # 7.6이상, petal.Legnth,Petal.Width만 출력
출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미
728x90
반응형