소요 시간: ~15분 | 사전 조건: 01. 환경 설정 완료 | 컴퓨트: Serverless 권장
이 모듈에서 사용하는 Databricks 기능
개요
PuriCare 공기청정기에서 수집되는 IoT 센서 데이터를 기반으로 8개 테이블, 약 100만 건의 가상 데이터를 생성합니다. ThinQ 플랫폼의 실제 IoT 데이터 구조를 반영하여, 공기질 센서·필터 상태·운전 모드 등 현실적인 필드와 값 분포를 가진 데이터를 만듭니다.데이터 아키텍처
테이블별 DDL 및 프롬프트
1. 디바이스 마스터 (ap_devices)
2. 공기질 센서 로그 (ap_air_quality_logs)
3. 필터 상태 (ap_filter_status)
4. 운전 모드 로그 (ap_operation_logs)
5. 전원 이벤트 (ap_power_events)
6. 전력 소비 (ap_energy_consumption)
7. ThinQ 원격 제어 명령 (ap_thinq_commands)
8. 알림 이벤트 (ap_alert_events)
데이터 검증
모든 테이블 생성 후 아래 프롬프트로 검증합니다:| 테이블 | 목표 건수 | 주요 컬럼 |
|---|---|---|
| ap_devices | 5,000 | device_id, model_name, region |
| ap_air_quality_logs | 300,000 | pm25, pm10, voc, co2 |
| ap_filter_status | 50,000 | filter_type, remaining_life_pct |
| ap_operation_logs | 200,000 | operation_mode, fan_speed |
| ap_power_events | 80,000 | power_state, trigger_source |
| ap_energy_consumption | 150,000 | power_watts, cumulative_kwh |
| ap_thinq_commands | 50,000 | command_type, execution_result |
| ap_alert_events | 30,000 | alert_type, severity |
다음 단계
- 03. 에어컨 데이터 생성 — 에어컨 IoT 센서 및 DDL 기반 가상 데이터 생성