본문 바로가기

728x90

데이터 전처리

(2)
[통계] Day 7-1 데이터 분석: 군집 분석 군집 분석은 비슷한 특성을 가진 데이터를 그룹으로 분류하는 데이터 마이닝 기법입니다. 데이터의 패턴과 유사성을 파악하며 이를 기반으로 그룹 간의 차이를 이해하는데 사용됩니다. 군집 분석은 고객 세그먼테이션, 행동 패턴 분석, 이미지 처리, 생물학적 분류 등 다양한 분야에서 활용되며 데이터를 구조화하고 파악하는 중요한 도구로 사용됩니다. 1. 목적 - 데이터 탐색과 시각화: 데이터의 복잡성을 이해하고 시각화하여 구조를 파악합니다. - 성질과 특성 파악: 데이터 그룹 간의 차이와 공통된 특성을 분석하여 인사이트를 도출합니다. - 데이터 전처리와 변수 선택: 변수들의 중요성을 평가하고 중복되거나 불필요한 변수를 제거합니다. - 예측 및 분류: 군집 분석을 통해 얻은 정보를 활용하여 예측 모델을 개발하거나 분류..
[통계] Day 1-1 데이터 분석 통계는 현대 사회에서 중요한 결정과 분석에 필수적인 도구로 사용되는 핵심 분야입니다. 이를 통해 데이터를 효과적으로 활용하여 패턴, 관계, 경향을 파악할 수 있으며, 이로부터 인사이트를 얻어 비즈니스 전략 수립, 문제 해결, 의사 결정 등 다양한 영역에서 큰 도움을 받을 수 있습니다. 데이터 통계는 데이터에 기반하여 정보를 추출하고 분석하는 과정입니다. 데이터는 관찰, 실험, 조사 등을 통해 수집된 정보를 말하며, 이러한 데이터는 크게 수량적 데이터와 질적 데이터로 구분됩니다. - 수량적 데이터: 숫자로 표현되는 데이터로, 예를 들면 금액, 시간, 온도 등이 있습니다. - 질적 데이터: 범주 혹은 카테고리로 표현되는 데이터로, 예를 들면 성별, 제품 카테고리, 학력 수준 등이 있습니다. 분포와 패턴 통계..