이 가이드 사용 방법
** 이 교육 자료는 Claude Code (또는 Cursor)와 함께 사용합니다.** 이 모듈에서는 UC Volume에 주기적으로 이벤트 데이터를 생성하고, Auto Loader + Structured Streaming으로 실시간 처리하는 End-to-End 흐름을 구축합니다.
학습 목표
- UC Volume에 주기적으로 가상 데이터 생성(Databricks App 활용)
- Auto Loader 로 새 파일 자동 감지 및 수집
- Structured Streaming 으로 실시간 Bronze → Silver 처리
- SDP + Streaming Table 로 선언적 실시간 파이프라인 구축
End-to-End 아키텍처
실무 대응
| 교육 (이 워크샵) | 실무 (Smart TV OEM) |
|---|---|
| Databricks App (이벤트 생성기) | IoT Gateway → S3/ADLS/Event Hub |
| UC Volume (JSON 파일) | S3 버킷 / ADLS / Event Hub |
| Auto Loader | Auto Loader (동일) 또는 Kafka Connector |
| SDP Pipeline | SDP Pipeline (동일) |
Step 1: Volume 및 Landing Zone 생성
Claude에게 요청하기
Step 2: 이벤트 생성기 스크립트
Claude에게 요청하기
Step 3: Databricks App으로 이벤트 생성기 배포
Claude에게 요청하기
Step 4: Auto Loader로 스트리밍 수집
Claude에게 요청하기
Step 5: SDP로 실시간 파이프라인 구성
Claude에게 요청하기
Step 6: 실시간 모니터링
Claude에게 요청하기
학습 정리
| 개념 | 실습 내용 |
|---|---|
| UC Volume | 파일 기반 데이터 랜딩존 (실무 S3/ADLS 대응) |
| Databricks App | 이벤트 생성기 배포 (FastAPI) |
| Auto Loader | cloudFiles 포맷, 새 파일 자동 감지, 스키마 추론 |
| Structured Streaming | readStream, append 모드, 체크포인트 |
| SDP + Streaming | @dp.table + Auto Loader, 실시간 Bronze→Silver→Gold |
| 실시간 모니터링 | 레이턴시 측정, Expectations 확인 |