728x90
반응형

상관분석과 상관계수

  • 자동차의 중랴잉 커지면 연비는 감소하는 추세
  • 추세의 모양이 선(line) 모양이어서 중량과 연비는 '선형적 관계'에 있다고 표현
  • 선형적 관계라고 해도 강한 선형적 관계가 있고 약한 선형적 관계도 있음
  • 상관분석(correlation anaylsis) : 얼마나 선형성을 보이는지 수치상으로 나타낼 수 있는 방법
  • 피어슨 상관계수(Pearson's correlation coefficient) : 그림1
  • -1 ≤ r ≤ 1
  • r > 0 : 양의 상관관계(x가 증가하면 y도 증가)
  • r < 0 : 음의 상관관계(x가 증가하면 y는 감소)
  • r = 0 : 상관관계 없음
  • r이 1이나 -1에 가까울수록 x,y의 상관성이 높음

[그림1] 피어슨 상관계수 식

 

 

상관계수의 계산

  • 음주정도와 혈중 알콜농도의 상관성 조사
더보기
# 상관계수 계산
beers = c(5,2,9,9,3,7,3,5,3,5) 
bal <- c(0.1,0.03,0.19,0.12,0.04,0.0095,0.07, 	# 자료 입력
         0.06,0.02,0.05)
tbl <- data.frame(beers,bal) # 데이터 프레임 생성
tbl
plot(bal~beers, data=tbl) # 산점도
res <- lm(bal~beers, data=tbl) # 회귀신 도출
abline(res) # 회귀선 그리기
cor(beers, bal) # 상관계수 계산

[그림2] 상관계수 계산 예제 출력
[그림3] 상관계수 계산 예제 출력
[그림4] 피어슨, 스피어만 개념

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기