Skip to main content
노트북 생성, MLOps 워크플로, 모델 서빙, GenAI/RAG, Unity Catalog 작업에 관한 프롬프트 레시피입니다.

6. 노트북 생성 및 구성

시나리오프롬프트
EDA”@sales.prod.transactions 종합 EDA. 기본 통계, 결측치, 분포, 상관관계, 이상치. 각 단계 마크다운 요약.”
데이터 정제”@raw.events 정제. 중복 제거, null 처리, 날짜 포맷 통일, 이상치 제거. 변환 전후 건수 표시.”
비교 분석”2025 vs 2024 orders. 매출/주문수/고객수 YoY 변화와 주요 드라이버 식별.”
코드 명령”/doc”, “/explain”, “/optimize”, “/test”, “/findTables”

고급 프롬프트

@prod.retail.transactions 기반 RFM 분석 노트북.
1. 데이터 로드 + 검증  2. RFM 점수 (5분위)  3. 고객 세그먼트 정의
4. 세그먼트별 시각화  5. 마케팅 전략 제안  6. 결과 테이블 저장
PySpark + plotly. 각 셀에 한국어 마크다운.

7. MLOps 워크플로

시나리오프롬프트
분류 모델”@customer_data로 이탈 예측. target=‘churned’. 정확도+AUC. MLflow 기록.”
회귀 모델”@housing_prices로 가격 예측. 하이퍼파라미터 튜닝으로 오차 개선.”
클러스터링”@sales_leads로 고객 세그먼트 식별. 각 클러스터 특성 요약.”
시계열 예측”@incidents로 향후 2주 일별 사건 수 예측. 테이블 + 차트.”
피처 엔지니어링”범주형 인코딩, 결측치 처리, 스케일링, 피처 선택.”
하이퍼파라미터 튜닝”XGBoost를 Optuna로 50회 튜닝. 최적 파라미터 + 개선폭 보고.”
모델 비교”LR, RF, XGB, LGBM 4가지 비교. AUC/정밀도/재현율 표. 최적 모델 MLflow 등록.”

고급 프롬프트

[데이터] @prod.manufacturing.sensor_readings  [목표] 설비 고장 예측 (failure)
[단계] EDA → 피처 엔지니어링(롤링 통계, lag) → 모델 비교(XGB/LGBM/RF) →
       불균형 처리(SMOTE) → Optuna 100회 → 평가(P/R/F1/AUC + 혼동 행렬) → MLflow
[제약] PySpark 피처, sklearn/xgboost 학습, 한국어 주석

8. 모델 서빙 & 엔드포인트 관리

시나리오프롬프트
헬스 체크”이 엔드포인트 건강 상태 확인.”
구성/스케일링 검토”구성이 올바른지 / 스케일링 구성 검토.”
배포 실패 진단”/diagnose” 또는 “왜 배포 실패?”
레이턴시 분석”레이턴시 스파이크 분석” / “지난 24시간 성능 메트릭.”
에러 패턴”지난 주 에러 패턴 분석.”
주의 모델 서빙의 Genie Code는 읽기 전용 어드바이저 입니다. Custom 엔드포인트에서만 지원됩니다.

9. GenAI / RAG 개발

시나리오프롬프트
RAG 체인”@prod.docs.knowledge_base 기반 RAG. Vector Search → 프롬프트 → LLM → 응답. LangChain.”
임베딩 생성”@raw.documents text 컬럼 임베딩 생성 + Vector Search 인덱스 저장.”
청킹 최적화”여러 청킹 전략 비교(고정/문장/의미). 검색 품질 최적 전략 추천.”
프롬프트 최적화”RAG 시스템 프롬프트 개선. 환각 감소, 소스 인용, 모르면 모른다고.”
Trace/실패 분석”tool calling 문제 trace 찾기” / “지난 주 실패 패턴.”
평가 실행”faithfulness, relevance, toxicity 평가. 저품질 케이스 원인 분류.”

고급 프롬프트

[데이터] @prod.docs.product_manuals (PDF 텍스트)
[단계] 청킹(500토큰/50오버랩) → 임베딩(Foundation Model) → Vector Search 인덱스 →
       LangChain RAG → 평가 Q&A 20개 생성 → MLflow 평가(faithfulness, relevance) → 개선 제안
시스템 프롬프트: 한국어, 소스 문서 인용 필수.

10. Unity Catalog 작업

시나리오프롬프트
테이블 생성”Delta 테이블: customer_id(BIGINT), name(STRING), email, signup_date. Liquid Clustering.”
뷰 생성”@raw.orders + @raw.customers 조인 뷰. 한국어 COMMENT.”
메타데이터”@prod.sales 스키마 모든 테이블에 테이블/컬럼 설명 자동 생성.”
테이블 검색”/findTables 고객 구매 이력”
최적화”OPTIMIZE + VACUUM + Z-ORDER 추천.”
리니지”@gold.revenue_summary의 데이터 리니지 추적.”