Processing math: 100%
본문 바로가기

IT/AI

[통계] Day 1-1 데이터 분석

728x90

통계는 현대 사회에서 중요한 결정과 분석에 필수적인 도구로 사용되는 핵심 분야입니다. 이를 통해 데이터를 효과적으로 활용하여 패턴, 관계, 경향을 파악할 수 있으며, 이로부터 인사이트를 얻어 비즈니스 전략 수립, 문제 해결, 의사 결정 등 다양한 영역에서 큰 도움을 받을 수 있습니다.

데이터
통계는 데이터에 기반하여 정보를 추출하고 분석하는 과정입니다. 데이터는 관찰, 실험, 조사 등을 통해 수집된 정보를 말하며, 이러한 데이터는 크게 수량적 데이터와 질적 데이터로 구분됩니다.

- 수량적 데이터: 숫자로 표현되는 데이터로, 예를 들면 금액, 시간, 온도 등이 있습니다.
- 질적 데이터: 범주 혹은 카테고리로 표현되는 데이터로, 예를 들면 성별, 제품 카테고리, 학력 수준 등이 있습니다.

분포와 패턴
통계는 데이터의 분포와 패턴을 분석하여 중요한 정보를 추출합니다. 이를 위해 대표값(평균, 중앙값, 최빈값 등)과 변이도(표준편차, 범위 등)를 계산하여 데이터의 특성을 파악합니다.

- 대표값: 데이터의 전반적인 경향을 나타내는 지표로, 평균이나 중앙값 등이 사용됩니다.
- 변이도: 데이터가 얼마나 퍼져있는지를 나타내는 지표로, 표준편차나 범위 등이 사용됩니다.

가설 검정과 추론
통계는 가설 검정과 추론을 통해 결론을 도출하는데 사용됩니다.

- 가설 검정: 주어진 데이터를 바탕으로 특정 가설이 옳은지 여부를 판단하는 과정입니다. 예를 들어, 새로운 약의 효과를 알아보기 위해 효과가 있는지 없는지에 대한 가설을 설정하고 데이터를 분석하여 검정합니다.
- 추론: 모집단 전체에 대한 정보가 없는 경우, 표본 데이터를 이용하여 모집단의 특성을 추측하는 과정입니다. 이를 통해 모집단의 특성을 파악하고 예측합니다.

통계는 다양한 분야에서 활용되며, 데이터 과학, 경제학, 의학, 사회과학 등 다양한 분야에서 중요한 도구로 사용되고 있습니다. 데이터의 중요성이 더욱 커지는 현대 사회에서 통계는 더욱 빠져서는 안 될 핵심 개념입니다.