본문 바로가기

728x90

상관분석

(2)
[통계] Day 3-1 상관 분석 데이터 분석과 통계 분야에서 중요한 개념 1. 상관 분석 $($Correlation Analysis$)$: - 변수 간의 관련성을 측정하는 통계 기법. - 두 변수 사이의 선형 관계 정도를 파악하며, 두 변수 간의 상관계수로 표현됨. - 피어슨 상관계수, 스피어만 상관계수, 켄달의 타우 등이 있음. 2. 피어슨 계수 $($Pearson Correlation Coefficient$)$: - 두 연속형 변수 간의 선형 상관관계를 측정하는 방법. - -1과 1 사이의 값을 가지며, 0은 상관관계가 없음을 나타냄. - 피어슨 상관계수 공식: \[ r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2} \cdot \sum{(y_i..
[통계] Day 1-3 데이터 형태: 연속형, 이산형, 범주형 데이터의 종류와 통계적 분석 방법 데이터는 다양한 형태로 존재하며, 이를 통계적으로 분석함으로써 유용한 정보와 인사이트를 얻을 수 있습니다. 데이터의 종류에 따라 적절한 통계적 분석 방법이 다르며, 데이터의 특성을 파악하는 것이 중요합니다. 여기에서는 데이터의 종류와 통계적 분석 방법에 대해 살펴보겠습니다. 1. 연속형 데이터(Continuous data) 연속형 데이터는 연속적인 값을 가지며, 정확한 수치로 측정됩니다. 예를 들어 온도, 길이, 시간 등이 연속형 데이터에 해당합니다. 이러한 데이터는 다양한 분포를 가지며, 주로 정규 분포를 따르는 경우가 많습니다. 데이터의 중심 경향성과 분산을 파악하여 이상치를 탐지하거나 추론 분석에 활용합니다. 2. 이산형 데이터(Discrete data) 이산형 데..