본문 바로가기

IT/AI

[통계] Day 1-1 데이터 분석

728x90

통계는 현대 사회에서 중요한 결정과 분석에 필수적인 도구로 사용되는 핵심 분야입니다. 이를 통해 데이터를 효과적으로 활용하여 패턴, 관계, 경향을 파악할 수 있으며, 이로부터 인사이트를 얻어 비즈니스 전략 수립, 문제 해결, 의사 결정 등 다양한 영역에서 큰 도움을 받을 수 있습니다.

데이터
통계는 데이터에 기반하여 정보를 추출하고 분석하는 과정입니다. 데이터는 관찰, 실험, 조사 등을 통해 수집된 정보를 말하며, 이러한 데이터는 크게 수량적 데이터와 질적 데이터로 구분됩니다.

- 수량적 데이터: 숫자로 표현되는 데이터로, 예를 들면 금액, 시간, 온도 등이 있습니다.
- 질적 데이터: 범주 혹은 카테고리로 표현되는 데이터로, 예를 들면 성별, 제품 카테고리, 학력 수준 등이 있습니다.

분포와 패턴
통계는 데이터의 분포와 패턴을 분석하여 중요한 정보를 추출합니다. 이를 위해 대표값$($평균, 중앙값, 최빈값 등$)$과 변이도$($표준편차, 범위 등$)$를 계산하여 데이터의 특성을 파악합니다.

- 대표값: 데이터의 전반적인 경향을 나타내는 지표로, 평균이나 중앙값 등이 사용됩니다.
- 변이도: 데이터가 얼마나 퍼져있는지를 나타내는 지표로, 표준편차나 범위 등이 사용됩니다.

가설 검정과 추론
통계는 가설 검정과 추론을 통해 결론을 도출하는데 사용됩니다.

- 가설 검정: 주어진 데이터를 바탕으로 특정 가설이 옳은지 여부를 판단하는 과정입니다. 예를 들어, 새로운 약의 효과를 알아보기 위해 효과가 있는지 없는지에 대한 가설을 설정하고 데이터를 분석하여 검정합니다.
- 추론: 모집단 전체에 대한 정보가 없는 경우, 표본 데이터를 이용하여 모집단의 특성을 추측하는 과정입니다. 이를 통해 모집단의 특성을 파악하고 예측합니다.

통계는 다양한 분야에서 활용되며, 데이터 과학, 경제학, 의학, 사회과학 등 다양한 분야에서 중요한 도구로 사용되고 있습니다. 데이터의 중요성이 더욱 커지는 현대 사회에서 통계는 더욱 빠져서는 안 될 핵심 개념입니다.