Skip to main content
최종 업데이트: 2026-04-07
가상 데이터 생성, 데이터 파이프라인, AI/BI 대시보드, Genie Space, Databricks Apps 코드 생성에 관한 프롬프트 레시피입니다.
참고 모든 프롬프트는 Agent 모드 에서 사용하는 것을 기본으로 합니다.

1. 가상 데이터 생성 (Synthetic Data Generation)

기본 프롬프트

전자상거래 분석용 샘플 데이터를 생성해줘.
- customers (10,000행): 고객 ID, 이름, 지역, 가입일, 등급
- orders (50,000행): 주문 ID, 고객 ID, 주문일, 금액, 상태
- products (500행): 제품 ID, 카테고리, 가격, 제조사
모든 테이블을 my_catalog.sandbox에 Delta 테이블로 저장해줘.

시나리오별 프롬프트

시나리오프롬프트
IoT 센서 데이터”공장 설비 모니터링용 IoT 센서 데이터를 생성해줘. 온도, 진동, 압력 센서 100개, 1분 간격, 30일치. 10% 이상치 포함.”
금융 거래 데이터”신용카드 거래 데이터 100만 건. 정상 97%, 사기 3%. 심야/고액/해외 패턴 포함.”
의료 데이터”환자 진료 기록. 5,000명, 50,000건. ICD-10, 처방, 입퇴원일. PII는 Faker로 가명 처리.”
기존 테이블 기반”@prod.sales.orders의 스키마와 분포를 분석해서 동일 패턴 테스트 데이터 10,000행 생성.”
시계열 데이터”주식 시장 데이터. 종목 50개, 일별 OHLCV, 5년치. 상승장/하락장/횡보장 패턴.”
다국어 텍스트”고객 리뷰. 한국어 60%, 영어 30%, 일본어 10%. 긍정/부정/중립 라벨 + 별점.”

고급 프롬프트

@prod.retail.transactions의 통계적 특성(분포, 상관관계, 결측치 비율)을
분석하고, 동일한 특성의 PII 제거 합성 데이터 100,000행을 생성해줘.
원본과 합성 데이터의 분포 비교 차트도 만들어줘.

2. 데이터 파이프라인 구축 (Lakeflow / SDP)

기본 프롬프트

my_catalog.my_schema의 transactions와 customers를 사용하여
사기 탐지를 위한 Medallion 아키텍처 파이프라인을 빌드하고 실행해줘.

시나리오별 프롬프트

시나리오프롬프트
전체 Medallion 구축”S3의 raw_events를 Auto Loader로 수집, Bronze → Silver → Gold SDP 파이프라인. 품질 규칙 포함.”
CDC 파이프라인”@raw.cdc_events에서 SCD Type 2로 고객 이력 관리 SDP 파이프라인.”
Auto Loader 수집”s3://my-bucket/logs/ JSON을 Auto Loader로 수집, 중첩 JSON 플랫닝.”
데이터 품질 규칙”@silver.orders에 품질 규칙 추가: amount > 0, 미래 날짜 금지, null 금지. 위반은 격리.”
파이프라인 오류 수정”이 파이프라인의 실패를 수정해줘.”
증분 처리 전환”배치를 Structured Streaming 증분 처리로 전환. 워터마크 + 중복 제거.”

고급 프롬프트

[소스] S3 clickstream (JSON) + Kafka user_events
[구조] Bronze(수집) → Silver(조인, 세션화, PII 마스킹) → Gold(DAU, 페이지뷰, 전환율)
[품질] 각 레이어별 검증 규칙 + quarantine 테이블
주의 프로덕션 카탈로그 대상 시 Agent 계획을 반드시 검토 후 승인하세요.

3. AI/BI 대시보드 생성

기본 프롬프트

@sales.prod.transactions를 분석하고 매출 성과 대시보드를 만들어줘.

시나리오별 프롬프트

시나리오프롬프트
경영진 대시보드”총매출/주문수/객단가 KPI, 월별 추이, 지역별 비교, 상위 10 제품 테이블.”
운영 모니터링”@system.billing.usage로 비용 모니터링. DBU 추이, 워크스페이스별 분포, 비싼 job Top 10.”
고객 분석”@customers + @orders 조인. 리텐션율, 이탈률, LTV 분포, 코호트 분석.”
시각화/필터 추가”라인 차트 추가” / “날짜 범위 + 지역 선택 필터 추가.”
스케치 기반 생성(이미지 첨부) “이 스케치 기반으로 대시보드 생성.”

고급 프롬프트

[소스] @analytics.sales.daily_metrics, customer_segments, product_performance
[페이지 1] KPI 카드(전월 대비 %), 매출 추이(전년 오버레이), 지역 히트맵
[페이지 2] 카테고리별 바 차트, 상위 20 제품 테이블, 파이 차트
[필터] 날짜 범위, 지역, 카테고리 (다중 선택)

4. Genie Space 활용 (MCP 연동)

시나리오프롬프트
데이터 준비”@raw.orders + @raw.customers 조인 뷰. 모든 컬럼에 한국어 COMMENT.”
메트릭 뷰”영업팀 Genie Space용 표준 KPI 뷰. 총매출, 순매출, 주문 수, 객단가, 반품률.”
품질 기준 뷰”회계 기준 매출 집계 뷰. 세금, 할인, 반품 반영.”
MCP 질의”Genie Space에 ‘지난 주 상위 5개 고객 매출은?’ 질문 후 결과로 추가 분석.”

5. Databricks Apps 코드 생성

시나리오프롬프트
Streamlit 앱”@analytics.customer_360 조회 대시보드. 검색, 필터, 매출 추이 차트. SQL Warehouse 연결.”
Gradio 챗봇”RAG 체인 호출 Gradio 챗봇. 서빙 엔드포인트, 대화 히스토리, 소스 문서 표시.”
FastAPI 백엔드”@prod.ml.predictions 조회 REST API. GET /predictions/{id} + 인증 미들웨어.”
app.yaml 생성”Streamlit 앱용 app.yaml. SQL Warehouse + 서빙 엔드포인트 리소스.”

고급 프롬프트

[프레임워크] Streamlit
[기능] 사이드바 필터 + KPI 카드 3개 + 매출 추이 + 이탈 위험 고객 목록
[제약] OAuth 인증, 한국어 UI, 에러 핸들링 포함
주의 Genie Code는 코드를 생성하지만 Databricks Apps에 직접 배포하지 않습니다. CLI나 UI로 배포하세요.