본문 바로가기

IT/AI

[DP] - 3 NOSQL과 Azure Storage

728x90

NOSQL$($Not Only SQL$)$
NOSQL은 "Not Only SQL"의 약자로, 관계형 데이터베이스가 아닌 다양한 데이터 모델과 저장 방식을 허용하는 데이터베이스 시스템을 지칭합니다. NOSQL 데이터베이스는 다양한 형태의 데이터를 저장하고 관리하는데 특화되어 있습니다. 

 


Azure Blob Storage
Azure Blob Storage는 이진 대형 객체$($Binary Large Object, BLOB$)$ 데이터에 대한 스토리지 솔루션입니다. 블록 Blob, 페이지 Blob, 추가 Blob의 세 가지 유형으로 구분됩니다. 블록 Blob은 크고 불연속적인 데이터를 저장하기에 적합하며 최대 4.7TB까지의 용량을 가질 수 있습니다. 페이지 Blob은 가상 디스크 스토리지로 사용되며 최대 8TB까지 지원합니다. 추가 Blob은 추가 작업을 최적화하는데 사용되며 최대 크기는 195GB를 초과하지 않습니다. Blob은 스토리지 계층을 가지며, 핫, 쿨, 보관 등의 계층으로 데이터를 관리할 수 있습니다.

  비용 대기 시간
가장 높은 비용 가장 낮은 대기 시간
더 낮은 비용 더 높은 대기 시간
보관 가장 낮은 비용 가장 높은 대기 시간

 

 

Azure Data Lake Store Gen 2
Azure Data Lake Store Gen 2는 Azure Blob Storage를 기반으로 하는 분산 파일 시스템입니다. 대용량 파일 저장 및 분석을 위해 고안되었으며, 파일 및 디렉터리 수준의 액세스 제어와 감사를 제공합니다. 데이터 레이크 스토어는 대규모 분석 시스템과 호환되며, 계층 구조 네임스페이스 옵션을 사용하여 데이터를 구조화할 수 있습니다.

 

계층 구조 네임스페이스 옵션을 통해 Azure Storage 계정에서 사용 방법
    - 계정을 만드는 동안 설정
    - 기존 스토리지 계정 업그레이드

 


Azure 파일
Azure 파일은 클라우드 파일 공유로, 인터넷 연결을 통해 어디서나 액세스할 수 있습니다. SMB$($서버 메시지 블록$)$ 및 NFS$($네트워크 파일 시스템$)$와 같은 일반적인 파일 공유 프로토콜을 지원합니다. 데이터는 중복성을 위해 복제되며, 미사용 시에는 암호화됩니다.

 


Azure Table Storage
Azure Table Storage는 키-값 기반의 NoSQL 데이터베이스로, 애플리케이션 데이터를 저장하기 위해 사용됩니다. 테이블은 키와 값 열로 구성되며, 행은 파티션으로 그룹화됩니다. 데이터 값에 대한 사용자 지정 속성 열을 포함하며, 데이터 변경 시 타임스탬프열이 자동으로 추가됩니다. 파티션 키를 통해 성능을 향상시킬 수 있습니다. 또한 속성 열에는 데이터 형식이 할당되며, 행마다 동일한 속성 열을 포함시키지 않아도 됩니다.

 

Azure Cosmos DB
Azure Cosmos DB는 다중 모델, 글로벌 규모 NoSQL 데이터베이스 관리 시스템입니다. 다양한 스토리지 API를 지원하며, 빠른 읽기 및 쓰기 성능으로 실시간 액세스를 지원합니다. Azure Cosmos DB는 다중 지역 쓰기를 통해 데이터를 전역적으로 복제하며, 다양한 API를 통해 MongoDB, Cassandra, Gremlin 등의 데이터 모델을 지원합니다.

MongoDB JSON$($BSON$)$
Table 키-값 스토리지 API/Azure Table Storage와 호환 가능
Apache Cassandra 열 패밀리 구조
Apache Gremlin 그래프 데이터 작업에 사용/ 꼭짓점은 관계$($엣지$)$를 통해 연결



이처럼 Azure는 다양한 NoSQL 및 Blob Storage 솔루션을 통해 사용자에게 데이터의 다양한 형태와 스토리지 옵션을 제공하고 있습니다.