[통계] Day 1-1 데이터 분석
통계는 현대 사회에서 중요한 결정과 분석에 필수적인 도구로 사용되는 핵심 분야입니다. 이를 통해 데이터를 효과적으로 활용하여 패턴, 관계, 경향을 파악할 수 있으며, 이로부터 인사이트를 얻어 비즈니스 전략 수립, 문제 해결, 의사 결정 등 다양한 영역에서 큰 도움을 받을 수 있습니다. 데이터 통계는 데이터에 기반하여 정보를 추출하고 분석하는 과정입니다. 데이터는 관찰, 실험, 조사 등을 통해 수집된 정보를 말하며, 이러한 데이터는 크게 수량적 데이터와 질적 데이터로 구분됩니다. - 수량적 데이터: 숫자로 표현되는 데이터로, 예를 들면 금액, 시간, 온도 등이 있습니다. - 질적 데이터: 범주 혹은 카테고리로 표현되는 데이터로, 예를 들면 성별, 제품 카테고리, 학력 수준 등이 있습니다. 분포와 패턴 통계..
[DP] - 1 데이터, 데이터 워크로드, Microsoft 클라우드 서비스
데이터란 무엇일까요? 데이터는 정보를 기록하는 데 사용되는 값들을 의미합니다. 이러한 값들은 종종 하나 이상의 속성을 가진 엔터티를 나타냅니다. 데이터는 크게 정형 데이터, 반정형 데이터, 비정형 데이터로 분류될 수 있습니다. 정형 데이터는 구조화된 테이블 형태로 저장되는 데이터이며, 반정형 데이터는 일부 구조화된 형태를 가지고 있지만 완전한 테이블 형태는 아닌 데이터를 의미하고, 비정형 데이터는 구조가 없는 데이터입니다. 데이터 저장 데이터는 파일 또는 데이터베이스를 통해 저장될 수 있습니다. 파일 형식으로는 텍스트 파일부터 JSON, XML 같은 형식, 그리고 BLOB$($Binary Large Object$)$ 등 다양한 형식이 있습니다. 최적화된 형식으로는 Avro, ORC, Parquet 등이 ..