728x90
반응형

결측값 인식

  • 결측값 자체의 의미가 있는 경우도 있다.
  • 결측값 처리는 전체 작업 속도에 많은 영향을 준다.
  • 결측값 처리 패키지 : Amelia, Mice, mistools
# 결측값 인식
x <- c(1,2,3,NA)
is.na(x)
mean(x)
mean(x,na.rm=T)

[그림1] 결측값 인식 예제 출력

 

결측값 처리 방법

 

1. 단순 대치법

  • completes analysis : 결측값이 존재하는 레코드를 삭제한다.
  • 평균대치법 : 관측 또는 실험을 통해 얻어진 데이터의 평균으로 대치
  • 비조건부 평균 대치법 : 평균으로 대치
  • 조건부 평균 대치법 : 회귀분석을 활용한 대치
  • 단순확률 대치법 : 평균대치법에서 추정량 표준 오차의 과소 추정문제를 보완하고자 고안된 방법(Hot-deck 방법, nearest neighboor 방법)

2. 다중 대치법

  • m번의 대치를 통해 m개의 가상적 완전 자료를 만드는 방법
  • 대치 -> 분석 -> 결합

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기