최종 업데이트: 2026-04-07가상 데이터 생성, 데이터 파이프라인, AI/BI 대시보드, Genie Space, Databricks Apps 코드 생성에 관한 프롬프트 레시피입니다.
참고 모든 프롬프트는 Agent 모드 에서 사용하는 것을 기본으로 합니다.
1. 가상 데이터 생성 (Synthetic Data Generation)
기본 프롬프트
시나리오별 프롬프트
| 시나리오 | 프롬프트 |
|---|---|
| IoT 센서 데이터 | ”공장 설비 모니터링용 IoT 센서 데이터를 생성해줘. 온도, 진동, 압력 센서 100개, 1분 간격, 30일치. 10% 이상치 포함.” |
| 금융 거래 데이터 | ”신용카드 거래 데이터 100만 건. 정상 97%, 사기 3%. 심야/고액/해외 패턴 포함.” |
| 의료 데이터 | ”환자 진료 기록. 5,000명, 50,000건. ICD-10, 처방, 입퇴원일. PII는 Faker로 가명 처리.” |
| 기존 테이블 기반 | ”@prod.sales.orders의 스키마와 분포를 분석해서 동일 패턴 테스트 데이터 10,000행 생성.” |
| 시계열 데이터 | ”주식 시장 데이터. 종목 50개, 일별 OHLCV, 5년치. 상승장/하락장/횡보장 패턴.” |
| 다국어 텍스트 | ”고객 리뷰. 한국어 60%, 영어 30%, 일본어 10%. 긍정/부정/중립 라벨 + 별점.” |
고급 프롬프트
2. 데이터 파이프라인 구축 (Lakeflow / SDP)
기본 프롬프트
시나리오별 프롬프트
| 시나리오 | 프롬프트 |
|---|---|
| 전체 Medallion 구축 | ”S3의 raw_events를 Auto Loader로 수집, Bronze → Silver → Gold SDP 파이프라인. 품질 규칙 포함.” |
| CDC 파이프라인 | ”@raw.cdc_events에서 SCD Type 2로 고객 이력 관리 SDP 파이프라인.” |
| Auto Loader 수집 | ”s3://my-bucket/logs/ JSON을 Auto Loader로 수집, 중첩 JSON 플랫닝.” |
| 데이터 품질 규칙 | ”@silver.orders에 품질 규칙 추가: amount > 0, 미래 날짜 금지, null 금지. 위반은 격리.” |
| 파이프라인 오류 수정 | ”이 파이프라인의 실패를 수정해줘.” |
| 증분 처리 전환 | ”배치를 Structured Streaming 증분 처리로 전환. 워터마크 + 중복 제거.” |
고급 프롬프트
주의 프로덕션 카탈로그 대상 시 Agent 계획을 반드시 검토 후 승인하세요.
3. AI/BI 대시보드 생성
기본 프롬프트
시나리오별 프롬프트
| 시나리오 | 프롬프트 |
|---|---|
| 경영진 대시보드 | ”총매출/주문수/객단가 KPI, 월별 추이, 지역별 비교, 상위 10 제품 테이블.” |
| 운영 모니터링 | ”@system.billing.usage로 비용 모니터링. DBU 추이, 워크스페이스별 분포, 비싼 job Top 10.” |
| 고객 분석 | ”@customers + @orders 조인. 리텐션율, 이탈률, LTV 분포, 코호트 분석.” |
| 시각화/필터 추가 | ”라인 차트 추가” / “날짜 범위 + 지역 선택 필터 추가.” |
| 스케치 기반 생성 | (이미지 첨부) “이 스케치 기반으로 대시보드 생성.” |
고급 프롬프트
4. Genie Space 활용 (MCP 연동)
| 시나리오 | 프롬프트 |
|---|---|
| 데이터 준비 | ”@raw.orders + @raw.customers 조인 뷰. 모든 컬럼에 한국어 COMMENT.” |
| 메트릭 뷰 | ”영업팀 Genie Space용 표준 KPI 뷰. 총매출, 순매출, 주문 수, 객단가, 반품률.” |
| 품질 기준 뷰 | ”회계 기준 매출 집계 뷰. 세금, 할인, 반품 반영.” |
| MCP 질의 | ”Genie Space에 ‘지난 주 상위 5개 고객 매출은?’ 질문 후 결과로 추가 분석.” |
5. Databricks Apps 코드 생성
| 시나리오 | 프롬프트 |
|---|---|
| Streamlit 앱 | ”@analytics.customer_360 조회 대시보드. 검색, 필터, 매출 추이 차트. SQL Warehouse 연결.” |
| Gradio 챗봇 | ”RAG 체인 호출 Gradio 챗봇. 서빙 엔드포인트, 대화 히스토리, 소스 문서 표시.” |
| FastAPI 백엔드 | ”@prod.ml.predictions 조회 REST API. GET /predictions/{id} + 인증 미들웨어.” |
| app.yaml 생성 | ”Streamlit 앱용 app.yaml. SQL Warehouse + 서빙 엔드포인트 리소스.” |
고급 프롬프트
주의 Genie Code는 코드를 생성하지만 Databricks Apps에 직접 배포하지 않습니다. CLI나 UI로 배포하세요.