통계적 이해 - 시계열 모형

2020. 8. 11. 19:48·데이터과학/ADSP
목차
  1. 시계열 모형
  2. 이동평균모형(Moving Average model , MA 모형)
  3. 자기회귀누적이동평균모형(ARIMA 모형)
  4. ① ARIMA(p,d,q) 모형
  5. 분해 시계열
  6. ① 추세 요인(trend factor)
  7. ② 계절 요인(seasonal factor) 
  8. ③ 순환 요인(cyclical factor)
  9. ④ 불규칙 요인(irregular factor)
728x90

시계열 모형

이동평균모형(Moving Average model , MA 모형)

  1. 이동평균 : 과거로부터 현재까지의 시계열 자료를 대상으로 일정기간별 이동평균을 계산하고, 이들의 추 세를 파악하여 다음 기간을 예측
  2. 이동평균모형은 유한개의 백색잡음의 선형 결합이므로 언제나 정상성을 만족
  3. 1차 이동평균모형, MA(1) 모형 : 가장 간단한 이동평균모형으로 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합으로 이루어진 모형
  4. 2차 이동평균모형, MA(2) 모형 : 바로 전 시점의 백색잡음과 시차가 2인 백색잡음의 결합으로 이뤄진 모형
  5. 자기상관함수 : p+1 시차 이후 급격히 감소하여 절단된 형태, MA(p) 모형
  6. 부분자기상관함수 : 점차 감소하는 형태

예) 전기사용량 : 봄보다 여름이 많아지고 가을에 다시 사용량이 적어진다. 이런 경우 이동평균모형을 이용한다.

 

 

자기회귀누적이동평균모형(ARIMA 모형)

  • 대부분의 많은 시계열 자료가 자기회귀누적이동평균모형을 따름 
  • ARIMA 모형은 기본적으로 비정상 시계열 모형 
  • → 차분이나 변환을 통해 AR 모형이나 MA 모형, ARMA 모형으로 정상화할 수 있음 

 

ARIMA 전에 ARMA모델이 존재 - ARMA : AR+MA

① ARIMA(p,d,q) 모형

  • p,d,q의 값에 따라 모형의 이름이 다르게 됨 
  • 차수 p : AR 모형과 관련 
  • 차수 q : MA 모형과 관련, 
  • 차수 d : ARIMA에서 ARMA로 정상화할 때 몇 번 차분을 했는지를 의미 
  • d=0이면 → ARMA(p,q) 모형이라 부르고, 정상성을 만족. 
  • p=0이면 → IMA(d,q) 모형이라고 부르고, d번 차분 → MA(q) 
  • q=0이면 → ARI(p,d) 모형이며, d번 차분한 시계열 모형 → AR(p) 모형

 

예제)

 

# ARIMA 모형 예제
install.packages("tseries")
install.packages("forecast")
library(tseries) # 시계열 분석 위한 패키지
library(forecast) # 시계열 예측을 위한 패키지

king <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3) # 3라인을 건너뛰고 벡터로 저장
king.ts <- ts(king) # 시계열 데이터 생성
plot(king.ts)
king.ff1 <- diff(king.ts,differences=1) # 1차 차분
plot.ts(king.ff1)
acf(king.ff1,lag.max=20) # lag는 1인 지점 뺴고는 모두 점선 구간 안에 있다.
acf(king.ff1,lag.max =20,plot=FALSE) 
pacf(king.ff1,lag.max=20) # 1,2,3에서 점선 구간을 초과하고 음의 값을 가지며 절단점이 lag4
pacf(king.ff1,lag.max = 20, plot=FALSE)

auto.arima(king) # 적절한 아리마 모형을 찾아준다
king.arima <- arima(king,order=c(0,1,1)) # 선정된 아리마 모형으로 데이터를 보정한다.
king.forecast <- forecast(king.arima) # ARIMA 모형에 의해 보정된 데이터를 통해 미래값을 예측한다.
king.forecast

 

[그림1] package 가져오고 데이터 생성 및 plot
[그림2] pacf 함수 이용해 조건넣어서 결과 확인
[그림3] 아리마 모형 찾기
[그림4] 아리마 모형으로 미래값 예측

 

[그림5] plot.ff1과 plot.ts 결과

 

[그림6] acf lag.max =20
[그림7] acf plot =FALSE

분해 시계열

  • 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법 
  • 시계열 구성 요소 

 

① 추세 요인(trend factor)

  • 자료가 특정한 형태를 취할 때 추세 요인이 있다고 한다.(선형적, 이차식, 지수 형태)

② 계절 요인(seasonal factor) 

  • 고정된 주기에 따라 자료가 변화하는 경우(요일,월,사분기자료에서 분기 변화)

③ 순환 요인(cyclical factor)

  • 명백한 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변 화하는 자료

④ 불규칙 요인(irregular factor)

  • 위의 3가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인

예제)

# 시계열 자료를 추세요인, 계졀요인, 불규칙요인으로 분해
ldeaths.decompose <- decompose(ldeaths)
plot(ldeaths.decompose)

 

[그림8] 시계열 자료를 추세요인, 계졀요인, 불규칙요인으로 분해

 

 

 

출처 : 2020 전면 개정판 ADsP 데이터 분석 준전문가 DATAEDU

728x90
저작자표시 비영리 변경금지
  1. 시계열 모형
  2. 이동평균모형(Moving Average model , MA 모형)
  3. 자기회귀누적이동평균모형(ARIMA 모형)
  4. ① ARIMA(p,d,q) 모형
  5. 분해 시계열
  6. ① 추세 요인(trend factor)
  7. ② 계절 요인(seasonal factor) 
  8. ③ 순환 요인(cyclical factor)
  9. ④ 불규칙 요인(irregular factor)
'데이터과학/ADSP' 카테고리의 다른 글
  • 통계적 이해 - 주성적 분석(PCA
  • 통계적 이해 - 다차원 척도법(Multidimensional Scaling,MDS)
  • 통계적 이해 - k 평균 군집(k-means clustering)
  • 통계적 이해 - 군집 분석, 계측적 분석, 거리 측정 방법, 거리
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      yolov10
      stylegan2
      R 원 그래프 퍼센트
      Coursera Python Data Structures
      확률
      R 원 그래프
      주성분 분석(PCA)
      none타입
      논문
      확률 분포
      CV
      시계열 모형
      str lib
      Python Regular Expression Quick Guide
      R 도수분포표
      지수분포
      k-평균 군집
      k-means clustering
      python 주요 데이터 타입
      yolov9
      자료의 종류
      통계량에 의한 자료 분석
      베르누이분포
      매핑형(딕셔너리)
      Python 크롤링 기초
      단순선형 회귀분석
      상관분석
      시퀀스형
      다차원 척보법
      Coursera 1
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    통계적 이해 - 시계열 모형

    개인정보

    • 티스토리 홈
    • 포럼
    • 로그인
    상단으로

    티스토리툴바

    단축키

    내 블로그

    내 블로그 - 관리자 홈 전환
    Q
    Q
    새 글 쓰기
    W
    W

    블로그 게시글

    글 수정 (권한 있는 경우)
    E
    E
    댓글 영역으로 이동
    C
    C

    모든 영역

    이 페이지의 URL 복사
    S
    S
    맨 위로 이동
    T
    T
    티스토리 홈 이동
    H
    H
    단축키 안내
    Shift + /
    ⇧ + /

    * 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.