통계적 이해 - 모집단의 모수에 대한 검정 방법
·
데이터과학/ADSP
모집단의 모수에 대한 검정 방법 ① 모수적 방법(parameteric method) 모집단의 분포에 대한 가정을 하고, 그 가정 하에서 검정 통계량과 검정 통계량이 분포를 유도해 검정을 실시하는 방법 ② 비모수적 방법(nonparameteric method) 자료가 추출된 모집단의 분포에 대해 아무 제약을 가하지 않고 검정을 실시하는 검정 방법 관측된 수치가 특정 분포를 따른다고 가정할 수 없는 경우에 사용 (예) 부호 검정(sign test), 윌콕슨의 순위합 검정(rank sum test), 윌콕슨의 부호 순위합 검정(signed rank test), 만-위트니의 U 검정, 런 검정(run test), 스피어만 순위상관계수 명목 척도, 순서 척도, 30개 미만일 경우 비모수적 방법 사용한다. 출처 :..
통계적 이해 - 가설 검정에서의 오류
·
데이터과학/ADSP
가설 검정에서의 오류(error) ① 제1종 오류(Type Ⅰ error: α) 귀무가설 H0이 옳은데도 H0 을 기각하게 되는 오류 ② 제2종 오류(Type Ⅱ error: β) 귀무가설 H0이 옳지 않은데도 H0 을 채택하게 되는 오류 두 가지 오류는 서로 상충관계 일반적으로 제1종 오류(α)의 크기를 0.01, 0.05, 0.1 등으로 고정시키고, 제2종 오류(β)가 최소가 되도록 기각역 설정 예) 판사의 판결에서 귀무가설은 피고는 무죄, 대립가설은 피고는 유죄 제1종 오류 : 실제로 무죄인 피고를 유죄로 판결 제2종 오류 : 실제로 유죄인 피고를 무죄로 판결 출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU
통계의 이해 - 통계적 추론, 가설 검정
·
데이터과학/ADSP
통계적 추론1 – 점 추정과 구간 추정 모집단으로부터 표본을 추출하여 뽑은 표본을 가지고 모집단을 추론하는 것 ① 점 추정(point estimation) 모수가 특정한 값일 것이라고 추정하는 것 예) 40대 여성의 평균 키는 160cm이다. (점 추정) 사실상 추정이 얼마나 정확한가를 판단하기가 불가능 ② 구간 추정 점 추정의 정확성을 보완하는 방법 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것, 예) 40대 여성의 평균 키는 155cm ~165cm 사이이다. 일반적인 신뢰수준 : 90%, 95%, 99% 확률 이용 95% 신뢰수준이란 100번 표본을 추출하여 신뢰구간을 구하는 경우 100개의 구간 중에 95개 구간이 모수 를 포함한다는 뜻 * 40대 모두를 조사할 수는 없..
통계의 이해 - 확률변수, 확률변수의 기댓값
·
데이터과학/ADSP
확률변수(random variable) 특정값이 나타날 가능성이 확률적으로 주어지는 변수 정의역이 표본공간, 치역이 실수값(0
통계의 이해 - 통계적 분석 방법, 확률, 조건부 확률
·
데이터과학/ADSP
통계적 분석 방법 ① 기술 통계(descriptive statistic) 수집된 자료를 정리·요약하기 위해 사용되는 기초통계 숫자로 표현하는 방식 : 평균, 표준편차, 중위수, 최빈값, % 그림으로 표현하는 방식 : 막대그래프, 원그래프, 꺽은선그래프 기술 통계 자체로도 여러 용도에 쓰이나 대개 자세한 통계적 분석을 위한 전 단계 역할 ② 추론 통계(추측 통계) : 추정, 가설검정(hypothesis test), 예측(forecasting) * 추정은 모수를 추정하는데 사용, 모수는 - 모집단의 특성 확률 특정 사건이 일어날 가능성의 척도 표본 공간(sample space, Ω) : 나타날 수 있는 모든 결과들의 집합 원소(element) : 나타날 수 있는 개개의 결과 사건(event) : 표본 공간의..
통계의 이해 - 통계, 표본 추출 방법, 자료의 종류, 데이터 척도의 구분
·
데이터과학/ADSP
통계 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 통계 자료의 획득 방법 : 총 조사(전수 조사), 표본조사 모집단(population) : 관심의 대상이 되는 모든 개체의 집합 표본(sample) : 모집단에서 실제로 뽑은 개체의 집합 모수(parameter) : 모집단에 대한 정보 예) 대학생의 음주율를 조사한다면 모집단 = 대학생 전체 표본 = 대학생 남녀 100명 - 대학생 전체를 조사하기는 매우 힘드니 표본을 대상으로 조사 모수 = 모집단은 모두 몇 명인지, 표준편차 등등 표본 추출 방법(4가지) ① 단순랜덤추출법(simple random sampling) N개의 원소로 구성된 모집단에서 n개의 표본을 추출할 때 각 원소에 1, 2, 3,..., N까지의..