통계량에 의한 자료 분석 ③ 산포의 측도 표본 분산, 표본 표준편차, 데이터의 범위, 사분위수 범위, 변동 계수 ④ 분포의 형태에 대한 측도 왜도, 첨도 그래프를 이용한 자료 정리 ① 막대그래프 범주형 자료(이산형 또는 질적 자료의 개수) 명목 척도 ② 히스토그램 연속형 자료 혹은 비율 ③ 줄기 잎 그림 ④ 상자 그림 ⑤ 산점도 가장 기본이 되는 그래프, x축과 y축으로 구성된 좌표 위에 이차원 자료를 점으로 표현하여 두 변수 간의 관계를 나타내는 데 사용하는 그래프 ⑥ 산점도에서 확인해야 할 사항 두 변수 사이의 선형(직선) 관계 두 변수 사이의 함수 관계(직선/곡선) 이상 값의 존재 확인 몇 개의 집단으로 구분되는지 확인 출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU
통계량에 의한 자료 분석
기술통계 자료를 요약하는 기초적 통계 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해봄으로써 데이터에 대한 대략적 이해와 분석에 대한 통찰력을 얻기에 유리 데이터 마이닝에 앞서 데이터의 기술 통계를 확인해보는 것이 좋음 ① head : 데이터를 앞에서 기본 6줄 보여줌 ↔ tail ② summary : 데이터의 컬럼에 대한 전반적인 기초 통계량 6개 기초 통계량 제공 최소값(min), 최대값(max), 25%백분위수(Q1), 75%백분위수(Q3), 중앙값(median), 평균(mean) 통계량에 의한 자료 분석 ① 중심 위치 측도 : 표본 평균, 중앙값, 최빈값 ② 중심 위치의 대푯값을 선정하는 기준 명목 척도로 측정된 데이터 → 최빈값 사용 분포가 대칭이고 이상값이 존재하지 않으면 → 표본 ..