728x90
반응형
결측값 인식
- 결측값 자체의 의미가 있는 경우도 있다.
- 결측값 처리는 전체 작업 속도에 많은 영향을 준다.
- 결측값 처리 패키지 : Amelia, Mice, mistools
# 결측값 인식
x <- c(1,2,3,NA)
is.na(x)
mean(x)
mean(x,na.rm=T)
결측값 처리 방법
1. 단순 대치법
- completes analysis : 결측값이 존재하는 레코드를 삭제한다.
- 평균대치법 : 관측 또는 실험을 통해 얻어진 데이터의 평균으로 대치
- 비조건부 평균 대치법 : 평균으로 대치
- 조건부 평균 대치법 : 회귀분석을 활용한 대치
- 단순확률 대치법 : 평균대치법에서 추정량 표준 오차의 과소 추정문제를 보완하고자 고안된 방법(Hot-deck 방법, nearest neighboor 방법)
2. 다중 대치법
- m번의 대치를 통해 m개의 가상적 완전 자료를 만드는 방법
- 대치 -> 분석 -> 결합
출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미
728x90
반응형