다중선형 회귀모델 만들기 단순선형 회귀가 하나의 독립변수를 다룬다면 다중선형 회귀는 여러 개의 독립변수를 다룬다. ex) 키와 몸무게를 가지고 혈당 수치를 예측 - 키(x1), 몸무게(x2) : 독립변수, 혈당수치(y) : 종속변수 다중 회귀모델(다중 회귀식)의 일반적인 형태 - 그림1 R에서는 다중 회귀모델도 lm()함수를 이용해 구한다. Mass 패키지의 "Cars93"이라는 데이터셋의 가격(Price)를 종속변수로 선정하고 엔진 크기(EngineSize), RPM, 무게(Weight)를 이용해 다중회귀분석 예제 # 다중선형 회귀분석 library(MASS) # MASS패키지 가져오기. head(Cars93) # cars93 head로 확인 attach(Cars93) # attach : 데이터를 R ..
주행속도와 제동거리 사이의 회귀모델 구하기 단순선형 회귀식을 구하기 위해서는 이론적인 이해가 필요하지만, R에서 제공하는 lm()함수를 이용해 쉽게 회귀식을 구할 수 있다. 독립변수는 주행속도고 종속변수는 제동거리 # 주행속도와 제공거리 사이의 회귀모델 구하기 head(cars) plot(dist~speed, data = cars) # 산점도를 통해 선형 관계 확인. model
회귀분석 관련 용어 증권회사에서는 미래의 주식 시세를 예측하기 위해 많은 연구 주식 시세는 기업의 매출액, 원유가격, 구겢정세, 정부정책 발표 등 매우 많은 요인들에 의해 영향 받는다. 독립변수(independent variable) : 주식시세에 영향을 미치는 요인들(기업의 매출액, 원유가격, 국제정세, 정부정책 발표) 종속변수(dependent variable) : 독립변수의 영향에 따라 값이 결정되는 주식시세 독립변수와 종속변수를 다른 용어로 각각 설명변수(explanatory variable)와 반응변수(response variable)라고도 한다. 예측모델(prediction model) 또는 예측모형 : 독립변수에 해당하는 자료와 종속변수에 해당하는 자료를 모아 관계를 분석하고 이를 예측에 사..
다중선형 회귀분석 출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU
회귀분석 ① 회귀분석 하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추론하는 통계 기법 단순선형회귀분석(독립변수가 하나)과 다중선형회귀분석(독립변수가 두 개 이상) ② 회귀분석의 변수 종속변수(반응변수, y) : 영향을 받는 변수 독립변수(설명변수, x, x1, x2) : 영향을 주는 변수 ③ 단순선형회귀분석 하나의 독립변수가 종속변수에 미치는 영향을 추정할 수 있는 통계기법 ① 회귀계수의 추정(최소제곱법, 최소자승법) 측정값을 기초로 하여 적당한 제곱합을 만들고 그것을 최소로 하는 값을 구하여 측정결과를 처리하는 방법으로 잔차제곱이 가장 작은 선을 구하는 것을 의미 ② 회귀분석의 검정 회귀계수 β1이 0이면 입력변수 x와 y 사이에 아무런 인과관계가 없음 회귀계수 β1 이 0이면 적합된 추정식..
상관관계 ① 상관관계 한 변수가 변화함에 따라 다른 변수가 어떻게 변화하는지와 같은 변화의 강도와 방향 ② 공분산(covariance) 두 확률변수 X, Y의 방향의 조합(선형성) Cov(x,y)=E[(X-μx )(Y- μy )] 공분산의 부호가 +이면 두 변수는 양의 방향성, 공분산의 부호가 –이면 두 변수는 음의 방향성을 가짐 X,Y가 독립이면 Cov(X,Y)=0 ③ 상관계수(Correlation coefficient) 두 변수의 상관관계를 알아봄 -1≤r≤1 상관분석 출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU