시계열 데이터 분석
독립변수 / 종속변수 + 시계열 데이터
- 정상 시계열
- 뚜렷한 추세 없음
- 시간 흐름에 따른 동일한 진폭
- 비정상 시계열
- 시간에 따른 데이터의 변화
- 추세와 시간대 존재
- 평균 수준이 시간대에 따라 다르다
- 가변적 분산
비정상 시계열일 경우 반드시 정상 시계열로의 변환 필요
비정상 시계열의 정상화
-
- 분산이 일정하지 않은 경우
-
분산안정화변환 ( 로그, 제곱근, Box-cox 변환 시도)
- 추세를 가지는 경우
- 결정적 추세 > 분해법 또는 추세항 모형에 포함
- 확률적 추세 ( Dickey-Fuller의 단위근 검정 ) > 차분
- 계절성을 가지는 경우
- 결정적 계절 추세 > 계절 추세항 모형에 포함
- 확률적 계절 추세 ( 계절형 단위근 검정 ) > 계절차분
ARIMA
- Auto Regression Intergrated with Moving Average
ARIMA(p, d, q) > 모수 설정
in Pandas
- arima 모형은 반드시 series 형태를 전제함
- 데이터 타입을 float으로 변경