시계열 데이터 (3) 썸네일형 리스트형 [통계] Day 5-2 시계열 데이터 분석 모델링 1. 시계열 데이터의 기본 가정 시계열 데이터 분석을 시작하기 전에 이해해야 할 기본 가정이 있습니다. 이러한 가정들은 데이터의 특성을 이해하고 모델링을 진행하는 데 도움을 줍니다. - 정상성 가정: 정상성은 시계열 데이터의 통계적 특성이 시간에 따라 일정하게 유지되는 것을 의미합니다. 이는 데이터의 평균과 분산이 시간에 따라 변하지 않으며, 시간에 따른 패턴이 일정하다는 것을 의미합니다. 정상성 가정을 만족하는 데이터는 예측이나 분석에 더욱 신뢰할 수 있습니다. - 독립성 가정: 시계열 데이터는 시간에 따른 의존성을 가지기 때문에 이전 시점의 데이터가 현재 시점의 데이터에 영향을 줄 수 있습니다. 따라서 전통적인 독립성 가정은 성립되지 않습니다. 이는 데이터의 특성을 고려하며 모델을 선택하고 구성할 때.. [통계] Day 5-1 시계열 데이터의 정규화 1. 정규화 변환의 필요성 - 데이터 스케일 조정의 중요성: 다양한 변수의 값 범위를 조정하여 모델이 각 변수에 공정하게 영향을 받도록 함. - 정규 분포 가정과 그 효과: 정규 분포를 따르는 데이터로 변환하여 통계적 분석을 용이하게 함. - 이상치 처리와의 관련성: 이상치가 정규화에 영향을 줄 수 있으며, 변환 후 이상치의 영향을 줄이기 위해 사용. - 시계열 패턴 강조와 모델 안정성: 시계열 패턴을 더 잘 드러나게 하며 모델의 안정성과 예측 성능 향상을 도모. 2. 주요 정규화 변환 방법 - 최소-최대 정규화 $($Min-Max Normalization$)$: 데이터 값을 최소값과 최대값 사이의 범위로 변환, 이상치에 민감하지 않은 경우 사용. $X_{\text{new}} = \frac{X - X_{.. [통계] Day 4-3 시계열 데이터의 이상치 시계열 이상치 시계열 데이터에서 이상치란 다른 관측치들과 동떨어진 값으로, 잘못된 측정, 데이터 수집 오류, 자연적인 이벤트의 특이한 결과 등의 요인으로 발생합니다. 이상치는 데이터 분석과 예측에 부정적인 영향을 미칠 수 있으며, 이를 감지하고 처리하는 것이 중요합니다. 이상치 탐지 이상치 탐지는 데이터의 품질을 향상시키는 중요한 단계입니다. 이상치가 제거되지 않으면 모델의 정확성이 떨어지고, 예측 결과에 신뢰성이 떨어질 수 있습니다. 이상치 탐지는 데이터 분석에서 정확한 정보를 얻는 핵심 과정 중 하나입니다. 또한 이상치 패턴을 파악하여 이를 원인 분석에 활용할 수 있습니다. 방법 1. 이동 평균과 이동 표준 편차: 이동 평균은 데이터 포인트의 이전 N개의 포인트의 평균을 계산하는 방법입니다. 이동 표.. 이전 1 다음