소요 시간: ~15분 | 사전 조건: 02. 공기청정기 데이터 생성 완료 | 컴퓨트: Serverless 권장
이 모듈에서 사용하는 Databricks 기능
개요
DUALCOOL/WHISEN 에어컨에서 수집되는 IoT 센서 데이터를 기반으로 9개 테이블, 약 120만 건의 가상 데이터를 생성합니다. 에어컨 특유의 냉/난방 사이클, 컴프레서 동작, 에너지 효율 등 실제 운전 데이터 구조를 반영합니다.데이터 아키텍처
테이블별 DDL 및 프롬프트
1. 디바이스 마스터 (ac_devices)
2. 온도 센서 로그 (ac_temperature_logs)
3. 습도 센서 로그 (ac_humidity_logs)
4. 운전 모드 로그 (ac_operation_logs)
5. 컴프레서 이벤트 (ac_compressor_events)
6. 전력 소비 (ac_energy_consumption)
7. ThinQ 원격 제어 명령 (ac_thinq_commands)
8. 알림 이벤트 (ac_alert_events)
9. 정비 이력 (ac_maintenance_logs)
데이터 검증
모든 테이블 생성 후 아래 프롬프트로 검증합니다:| 테이블 | 목표 건수 | 주요 컬럼 |
|---|---|---|
| ac_devices | 8,000 | device_id, model_name, capacity_btu |
| ac_temperature_logs | 400,000 | indoor_temp, outdoor_temp, set_temp |
| ac_humidity_logs | 200,000 | indoor_humidity, dehumidify_amount |
| ac_operation_logs | 250,000 | operation_mode, fan_speed, fan_direction |
| ac_compressor_events | 80,000 | compressor_state, frequency_hz |
| ac_energy_consumption | 200,000 | power_watts, eer |
| ac_thinq_commands | 60,000 | command_type, execution_result |
| ac_alert_events | 30,000 | alert_type, error_code, severity |
| ac_maintenance_logs | 20,000 | maintenance_type, cost_krw |
다음 단계
- 04. SDP 파이프라인 — 공기청정기 + 에어컨 데이터를 Bronze → Silver → Gold로 변환하는 파이프라인 구축