데이터 분석과 빅데이터 세계에 들어가기 전에 알아두면 좋은 배경 지식을 다룹니다. 빅데이터 기술이 왜 생겨났는지, 어떤 역사를 거쳐 현재의 모습이 되었는지 흐름을 이해하는 것이 이후 학습에 큰 도움이 됩니다.
학습 목표
- 관계형 데이터베이스(RDB)의 핵심 개념과 설계 패턴(정규화, Star/Snowflake 스키마) 이해
- 빅데이터의 등장 배경과 Hadoop에서 시작된 기술 생태계 흐름 파악
- 주요 빅데이터 솔루션과 벤더의 역사 및 현재 위치 이해
- 실시간 데이터 처리를 위한 기술 스택(Kafka, Flink 등) 개요 파악
문서 목록
| 순서 | 문서 | 내용 |
|---|---|---|
| 1 | 관계형 데이터베이스 기초 | 테이블, 키, 조인, SQL, ACID — RDB의 핵심 개념을 정리합니다 |
| 2 | 데이터 모델링 — Star/Snowflake 스키마 | 정규화, 비정규화, 팩트/디멘전, Star 스키마, Snowflake 스키마 설계 패턴을 다룹니다 |
| 3 | 빅데이터의 역사 | Google 논문에서 Hadoop, Spark, 레이크하우스까지의 기술 진화 흐름을 살펴봅니다 |
| 4 | 빅데이터 생태계 | 주요 솔루션, 빅 플레이어, 기술 지도를 한눈에 정리합니다 |
| 5 | 실시간 처리 기술 | Kafka, Flink, Spark Streaming, 이벤트 드리븐 아키텍처를 설명합니다 |