빅데이터 7일차 - set.seed(), 데이터 조합

2020. 7. 28. 11:47·데이터과학/R
728x90

set.seed()함수

  • sample()함수는 임의로 샘플을 추출하는 방식이다. 때문에 함수를 실행할 때마다 매번 그 결과가 다르다.
  • 이런 경우 set.seed()함수를 sample()함수 실행 전에 먼저 실행한다.
  • set.seed()함수의 매개변수 값이 같으면 sample()함수의 결과도 같다.
# set.seed()함수
sample(1:20, size=5) # 비복원 추출

set.seed(100)
sample(1:20,size=5)
set.seed(100)
sample(1:20,size=5)
set.seed(100)
sample(1:20,size=5)

 

 

[그림1] 비복원 추출
[그림2] set.seed()함수 사용 예제 출력

 

데이터 조합

  • 조합(combination) : 글자 그대로 주어진 데이터 값들 중에서 몇 개씩 짝을 지어 추출하는 작업
  • combn() 함수를 사용하며, 결과에서 각 열이 하나의 조합을 의미한다.
# 데이터 조합, combn()

combn(1:10, 3) # 1~10에서 5개를 뽑는 조합

num <- c("Red 4","Dark Blue","Light State Blue","Lavender Blush","Turquoise 1")
com <- combn(num,2) # num의 원소 2개씩 뽑는 조합
com

for(i in 1:ncol(com)){
  cat(com[,i],"\n") # 조합을 출력
}

[그림3] combn() 예제 출력
[그림4] 원소 2개씩 뽑아 출력
[그림5] 조합 출력

 

출처 : 모두를 위한 R 데이터 분석 입문 한빛아카데미

728x90
저작자표시 비영리 변경금지 (새창열림)
'데이터과학/R' 카테고리의 다른 글
  • 빅데이터7일차 - 데이터 병합
  • 빅데이터 7일차 - 데이터 집계
  • 빅데이터7일차 - 데이터 샘플링,숫자,행 임의로 추출하기
  • 빅데이터 7일차 - 데이터 분리, 데이터 선택
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      확률
      R 원 그래프 퍼센트
      자료의 종류
      python 주요 데이터 타입
      확률 분포
      Python 크롤링 기초
      지수분포
      yolov9
      논문
      다차원 척보법
      k-means clustering
      R 도수분포표
      Coursera 1
      none타입
      stylegan2
      시계열 모형
      베르누이분포
      yolov10
      매핑형(딕셔너리)
      주성분 분석(PCA)
      시퀀스형
      CV
      k-평균 군집
      R 원 그래프
      단순선형 회귀분석
      str lib
      Python Regular Expression Quick Guide
      통계량에 의한 자료 분석
      상관분석
      Coursera Python Data Structures
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    빅데이터 7일차 - set.seed(), 데이터 조합
    상단으로

    티스토리툴바