빅데이터 5일차 - 산점도, pch의 종류

2020. 7. 20. 12:21·데이터과학/R
728x90

 두 변수 사이의 산점도

  • mtcars 데이터 : 174년 Motor Trend US 잡지에서 발췌한 것으로, 연료소비와 자동차 디자인 및 성능에 관한 자동차의 10가지 측면과 32대의 자동차로 구성
  • mtcars 데이터셋에서 자동차의 중량(wt)과 연비(mpg) 사이의 관계
더보기
? mtcars
str(mtcars)
head(mtcars)
wt <- mtcars$wt # 중량 자료
mpg <- mtcars$mpg # 연비 자료
plot(wt,mpg, main="중량 - 연비 그래프",xlab = "중량",ylab="연비(MPG)",col="red",pch='point')
# wt,mpt = 2개 변수(x축,y축) col = point의 color, pch = point의 종류

[그림1] 두 변수 사이의 산점도 예제 출력
[그림2] 두 변수 사이의 산점도 예제 출력
[그림3] ?mtcars 출력 결과
[그림4] 두 변수 사이의 산점도 예제 출력
[그림5] pch 20 출력 결과

 

 

pch의 종류

[그림6] pch의 종류 출처 : http://www.datamarket.kr/xe/board_AGDR50/187

128~255는 아직 구현되지않아 공백

 

 

여러 변수들 간의 산점도

  • paris() 함수 : 여러 개의 변수에 대해 짝지어진 산점도를 한 번에 그림
  • mpg(연비), disp(배기량), drat(리어액슬기어비), wt(중량)만 선택해 target 데이터셋을 새로 만들어 산점도 출력

 

 

그룹 정보가 있는 두 변수의 산점도

  • 그룹 정보를 알고 있다면 산점도를 작성 시 각 그룹별 관측값들을 다른 색깔과 점의 모양으로 표시할 수 있음
  • 이렇게 작성된 산점도는 두 변수 간의 관계뿐만 아니라 그룹 간의 관계도 파악할 수 있어서 편리하다.
더보기
# 그룹 정보가 있는 두 변수의 산점도
iris.2 <- iris[,3:4]
point <- as.numeric(iris$Species) # 점의 모양
point
color <- c('Royal Blue','Spring Green','Red 4')
color
plot(iris.2, main="Iris plot",pch = c(point),col=color[point])

[그림7] 그룹 정보가 있는 두 변수의 산점도 예제 출력
[그림8] 그룹 정보가 있는 두 변수의 산점도 예제 출력

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/R' 카테고리의 다른 글
  • 빅데이터 6일차 - 데이터 댐과 데이터 레이블링
  • 빅데이터 5일차 - 상관분석과 상관계수
  • 빅데이터 5일차 - 복습
  • 빅데이터 4일차 - R 한 화면에 그래프 여러 개 출력
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      다차원 척보법
      k-평균 군집
      시퀀스형
      시계열 모형
      python 주요 데이터 타입
      none타입
      상관분석
      yolov10
      Coursera Python Data Structures
      str lib
      yolov9
      R 원 그래프
      주성분 분석(PCA)
      Coursera 1
      확률 분포
      Python Regular Expression Quick Guide
      논문
      자료의 종류
      CV
      통계량에 의한 자료 분석
      확률
      매핑형(딕셔너리)
      베르누이분포
      단순선형 회귀분석
      k-means clustering
      R 도수분포표
      Python 크롤링 기초
      stylegan2
      지수분포
      R 원 그래프 퍼센트
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    빅데이터 5일차 - 산점도, pch의 종류
    상단으로

    티스토리툴바