개인 일정/공부

개인 일정/공부

객체 스토리지 시스템, 직렬화, 역직렬화

객체 스토리지 시스템 (Object Storage System) - 객체 스토리지 시스템은 데이터를 저장하는 데 사용되는 혁신적인 기술 - 데이터를 객체 단위로 저장하며, 각 객체는 데이터 자체와 해당 데이터에 대한 메타데이터를 포함 - 대량의 데이터를 효율적으로 관리하고 액세스하는 데 매우 유용 객체 스토리지 시스템 특징 (Features of Object Storage Systems) 1. 객체 - 객체 스토리지 시스템에서 데이터의 기본 단위 - 각 객체는 데이터 자체와 해당 데이터에 대한 메타데이터를 포함 (생성 일자, 크기, 유형) 2. 분산 스토리지 - 객체 스토리지 시스템은 보통 분산 스토리지 아키텍처를 기반으로 함 - 데이터를 여러 물리적 위치에 분산하여 저장하고 관리함으로써 확장성과 내결함..

개인 일정/공부

인먼 데이터웨어하우스란

인먼 데이터웨어하우스는 기업이나 조직이 다양한 소스에서 수집한 데이터를 중앙 집중화하여 저장, 관리, 분석하는 시스템입니다. 데이터웨어하우스는 의사 결정을 지원하고 비즈니스 인텔리전스(Business Intelligence, BI)를 제공하기 위해 사용됩니다. 다양한 데이터 소스로부터 데이터를 추출하고 변환하여 데이터웨어하우스에 적재하는 과정을 ETL(Extract, Transform, Load) 프로세스라고 합니다. 이 과정에서 데이터는 일관된 형식으로 표준화되고, 데이터 품질이 관리되며, 필요에 따라 집계되거나 요약됩니다. 데이터웨어하우스는 크게 두 가지 형태로 구성될 수 있습니다. 1. **전통적인 데이터웨어하우스**: 일반적으로 중앙 집중식 아키텍처를 기반으로 하며, 대규모의 데이터를 처리할 수 ..

개인 일정/공부

메세지큐 시스템이란?

메시지 큐(Message Queue)는 컴퓨터 시스템 간에 데이터를 비동기적으로 전송하는 데 사용되는 소프트웨어 패턴 또는 시스템입니다. 이는 발신자와 수신자 간의 통신을 위해 사용됩니다. 메시지 큐는 일반적으로 다음과 같은 기능을 제공합니다. 1. **비동기 통신**: 메시지 큐는 발신자와 수신자 간의 통신을 비동기적으로 처리합니다. 이는 발신자가 메시지를 전송하면, 해당 메시지가 바로 처리되지 않고 메시지 큐에 저장되며, 나중에 수신자가 메시지를 처리할 준비가 될 때까지 대기합니다. 2. **간접 통신**: 발신자와 수신자 간의 통신은 직접적으로 이루어지지 않고, 메시지 큐를 통해 이루어집니다. 이를 통해 발신자와 수신자 간의 결합도를 낮추고 유연성을 제공합니다. 3. **이벤트 기반 아키텍처**: ..

개인 일정/공부

핫 데이터, 웜 데이터, 콜드 데이터란

핫 데이터, 웜 데이터, 콜드 데이터는 데이터 관리와 저장에 관련된 용어들이며, 주로 데이터의 활용 빈도와 관련하여 사용됩니다. 1. 핫 데이터 (Hot Data): - 핫 데이터는 매우 빈번하게 액세스되고 업데이트되는 데이터를 가리킵니다. - 보통 실시간 처리나 빠른 응답이 요구되는 작업에 사용됩니다. - 예를 들어, 온라인 거래 데이터, 실시간 센서 데이터, 실시간 로그 등이 핫 데이터에 해당할 수 있습니다. - 보통 높은 성능과 고가용성을 제공하는 스토리지 시스템에 저장됩니다. 2. 웜 데이터 (Warm Data): - 웜 데이터는 핫 데이터보다는 덜 빈번하게 액세스되지만, 여전히 자주 액세스되는 데이터를 의미합니다. - 주로 분석이나 보고서 생성과 같은 작업에 사용됩니다. - 예를 들어, 몇 주 ..

개인 일정/공부

메세지 큐 시스템이란

메시지 큐(Message Queue) 시스템은 분산 시스템에서 다른 컴포넌트 간에 데이터를 안전하게 전달하는 데 사용되는 중요한 컴퓨팅 구성 요소입니다. 이 시스템은 송신자가 메시지를 생성하고 수신자가 해당 메시지를 소비하는 방식으로 작동합니다. 여기에는 몇 가지 주요 구성 요소와 개념이 있습니다: 1. **메시지**: 메시지 큐를 통해 전송되는 데이터 단위입니다. 메시지는 일반적으로 텍스트, JSON, XML 또는 기타 형식의 데이터일 수 있습니다. 예를 들어, 주문을 처리하는 온라인 상점 애플리케이션의 경우 주문 정보가 메시지로 표현될 수 있습니다. 2. **생산자(Producer)**: 메시지를 생성하여 메시지 큐에 넣는 역할을 하는 애플리케이션, 프로세스 또는 컴포넌트입니다. 주문을 처리하는 시스..

개인 일정/공부

AWS IAM이란?

AWS IAM(Identity and Access Management)은 AWS(아마존 웹 서비스)에서 제공하는 서비스 중 하나로, AWS 리소스에 대한 인증 및 권한 관리를 중앙 집중화하는 데 사용됩니다. IAM을 사용하면 사용자, 그룹 및 역할을 생성하고 관리하여 각 사용자 또는 리소스에 대한 액세스 권한을 정확히 제어할 수 있습니다. 이를 통해 보안을 강화하고 AWS 리소스에 대한 액세스를 제한할 수 있습니다. 여러 가지 주요 개념과 기능이 있습니다: 1. **사용자(Users)**: AWS 계정에 대한 액세스를 개별적으로 관리할 수 있는 개체입니다. 사용자는 AWS 리소스에 대한 액세스를 요청할 수 있습니다. 2. **그룹(Groups)**: 여러 사용자에 대한 권한을 일괄적으로 관리할 수 있는 ..

개인 일정/공부

데이터 아키텍처란?

데이터 아키텍처는 데이터의 저장, 관리, 이동, 처리 및 보호를 위한 구조와 프로세스를 설계하는 것을 의미합니다. 이는 조직이 데이터를 효과적으로 활용하여 비즈니스 목표를 달성하는 데 도움이 됩니다. 데이터 아키텍처는 주로 다음과 같은 요소로 구성됩니다. 1. **데이터 소스 및 수집**: 데이터는 다양한 소스에서 생성되며, 데이터 아키텍처는 이러한 다양한 소스에서 데이터를 수집하는 방법을 정의합니다. 소스에는 내부 시스템, 외부 파트너, 웹 서비스, 센서, 소셜 미디어 등이 포함될 수 있습니다. 데이터는 실시간으로 스트리밍되거나 배치 프로세스를 통해 주기적으로 수집될 수 있습니다. 2. **데이터 저장**: 수집된 데이터는 저장되어야 합니다. 데이터 아키텍처는 어디에 데이터를 저장할지, 어떤 형식으로 ..

개인 일정/공부

데이터옵스란

데이터 옵스(DataOps)는 데이터 관리 및 데이터 파이프라인을 자동화하고 효율화하는 프로세스와 방법론입니다. 소프트웨어 개발에서의 DevOps(Development Operations)가 소프트웨어 개발과 운영 간의 경계를 허물고 지속적인 통합 및 배포를 통해 효율성을 높이는 데 중점을 두듯이, 데이터 옵스는 데이터 관리와 운영을 통합하여 데이터에 대한 개발과 운영 사이의 경계를 허물어 데이터 파이프라인을 개선하고 지속적인 데이터 통합 및 배포를 가능하게 합니다. 데이터 옵스의 핵심 목표는 다음과 같습니다: 1. **자동화된 데이터 파이프라인 구축**: 데이터 수집, 전처리, 저장, 분석 및 배포 과정을 자동화하여 시간과 비용을 절감하고 효율성을 높입니다. 2. **데이터 품질 관리**: 데이터 품질..

개인 일정/공부

데이터 엔지니어링이란

데이터 엔지니어링은 데이터를 수집, 저장, 처리, 및 관리하기 위한 기술과 방법론을 연구하고 적용하는 분야입니다. 이는 주로 대규모 데이터를 다루는 기업이나 조직에서 중요한 역할을 합니다. 데이터 엔지니어링은 데이터를 비즈니스 목적에 맞게 구조화하고 가공하여 의사 결정에 도움을 주는 것을 목표로 합니다. 다음은 데이터 엔지니어링에서 수행되는 주요 작업들입니다: 1. **데이터 수집**: 다양한 소스에서 데이터를 수집합니다. 이는 외부 데이터 소스에서의 데이터 스크래핑, API를 통한 데이터 추출, 내부 시스템 로그, 센서 데이터 등 다양한 형태일 수 있습니다. 2. **데이터 저장**: 수집된 데이터를 안정적으로 저장하는 것이 중요합니다. 이를 위해 대용량 데이터베이스 시스템을 사용하거나 분산 저장 시스..

개인 일정/공부

Apache Kafka CDC란

Kafka CDC는 Apache Kafka의 Change Data Capture(CDC)를 의미합니다. CDC는 데이터베이스나 데이터 스토어 등에서 변경된 데이터를 실시간으로 감지하고 이를 다른 시스템으로 전파하는 기술입니다. Kafka는 이러한 CDC 기능을 제공하여 데이터 소스에서 변경 사항을 효율적으로 캡처하고 이를 다양한 소비자 애플리케이션으로 전달할 수 있도록 지원합니다. Kafka CDC의 주요 특징과 동작 원리는 다음과 같습니다: 1. 데이터 캡처: Kafka CDC는 데이터베이스나 기타 소스 시스템에서 변경 사항을 실시간으로 감지하고 Kafka 토픽으로 데이터를 캡처합니다. 이는 데이터베이스의 INSERT, UPDATE, DELETE와 같은 변경 작업을 식별하고 해당 변경 사항을 Kafka..

박경태
'개인 일정/공부' 카테고리의 글 목록