데이터 엔지니어링의 세계에 첫 발을 내딛기 위한 기초 개념을 다룹니다.
학습 목표
- 데이터가 왜 중요한지, 기업에서 데이터를 어떻게 활용하는지 이해
- 데이터 웨어하우스, 데이터 레이크의 개념과 차이점 파악
- ETL/ELT 파이프라인의 기본 흐름 이해
- 배치(Batch) 처리와 스트리밍(Streaming) 처리의 차이 이해
문서 목록
| 순서 | 문서 | 내용 |
|---|---|---|
| 1 | 데이터 엔지니어링이란? | 역할, 필요성, 데이터 흐름의 큰 그림을 설명합니다 |
| 2 | 데이터 웨어하우스 vs 데이터 레이크 | 각각의 특징, 장단점을 비교합니다 |
| 3 | ETL과 ELT | 데이터 수집·변환·적재의 기본 패턴을 다룹니다 |
| 4 | 배치 처리 vs 스트리밍 처리 | 언제 무엇을 쓰는지 선택 기준을 안내합니다 |
| 5 | 정형·반정형·비정형 데이터 | 데이터 유형별 특징과 처리 방법을 설명합니다 |