상관분석과 상관계수 자동차의 중랴잉 커지면 연비는 감소하는 추세 추세의 모양이 선(line) 모양이어서 중량과 연비는 '선형적 관계'에 있다고 표현 선형적 관계라고 해도 강한 선형적 관계가 있고 약한 선형적 관계도 있음 상관분석(correlation anaylsis) : 얼마나 선형성을 보이는지 수치상으로 나타낼 수 있는 방법 피어슨 상관계수(Pearson's correlation coefficient) : 그림1 -1 ≤ r ≤ 1 r > 0 : 양의 상관관계(x가 증가하면 y도 증가) r < 0 : 음의 상관관계(x가 증가하면 y는 감소) r = 0 : 상관관계 없음 r이 1이나 -1에 가까울수록 x,y의 상관성이 높음 상관계수의 계산 음주정도와 혈중 알콜농도의 상관성 조사 더보기 # 상관계수 계산 ..
두 변수 사이의 산점도 mtcars 데이터 : 174년 Motor Trend US 잡지에서 발췌한 것으로, 연료소비와 자동차 디자인 및 성능에 관한 자동차의 10가지 측면과 32대의 자동차로 구성 mtcars 데이터셋에서 자동차의 중량(wt)과 연비(mpg) 사이의 관계 더보기 ? mtcars str(mtcars) head(mtcars) wt
사용한 데이터 제주 올레코스 현황 https://www.data.go.kr/data/15043496/fileData.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 더보기 getwd() setwd("D:/R") jeju
통계적 분석 방법 ① 기술 통계(descriptive statistic) 수집된 자료를 정리·요약하기 위해 사용되는 기초통계 숫자로 표현하는 방식 : 평균, 표준편차, 중위수, 최빈값, % 그림으로 표현하는 방식 : 막대그래프, 원그래프, 꺽은선그래프 기술 통계 자체로도 여러 용도에 쓰이나 대개 자세한 통계적 분석을 위한 전 단계 역할 ② 추론 통계(추측 통계) : 추정, 가설검정(hypothesis test), 예측(forecasting) * 추정은 모수를 추정하는데 사용, 모수는 - 모집단의 특성 확률 특정 사건이 일어날 가능성의 척도 표본 공간(sample space, Ω) : 나타날 수 있는 모든 결과들의 집합 원소(element) : 나타날 수 있는 개개의 결과 사건(event) : 표본 공간의..
통계 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 통계 자료의 획득 방법 : 총 조사(전수 조사), 표본조사 모집단(population) : 관심의 대상이 되는 모든 개체의 집합 표본(sample) : 모집단에서 실제로 뽑은 개체의 집합 모수(parameter) : 모집단에 대한 정보 예) 대학생의 음주율를 조사한다면 모집단 = 대학생 전체 표본 = 대학생 남녀 100명 - 대학생 전체를 조사하기는 매우 힘드니 표본을 대상으로 조사 모수 = 모집단은 모두 몇 명인지, 표준편차 등등 표본 추출 방법(4가지) ① 단순랜덤추출법(simple random sampling) N개의 원소로 구성된 모집단에서 n개의 표본을 추출할 때 각 원소에 1, 2, 3,..., N까지의..
R에서는 화면을 여러 개로 가상 분할한 후, 각각의 분할된 화면에 여러 개의 그래프를 출력하는 기능을 제공한다. 더보기 # 한 화면에 그래프 여러 개 출력하기 par(mfrow=c(1,3)) # 1*3개의 가상화면 분할 barplot(table(mtcars$carb), main = "Barplot of Carburetors", xlab = "$#of carburetors", ylab = "frequency", col = "blue") barplot(table(mtcars$cyl), main = "Barplot of Cylender", xlab = "#of cylender", ylab = "frequency", col ="red") barplot(table(mtcars$gear), main = "Barpl..