6. 노트북 생성 및 구성
| 시나리오 | 프롬프트 |
|---|---|
| EDA | ”@sales.prod.transactions 종합 EDA. 기본 통계, 결측치, 분포, 상관관계, 이상치. 각 단계 마크다운 요약.” |
| 데이터 정제 | ”@raw.events 정제. 중복 제거, null 처리, 날짜 포맷 통일, 이상치 제거. 변환 전후 건수 표시.” |
| 비교 분석 | ”2025 vs 2024 orders. 매출/주문수/고객수 YoY 변화와 주요 드라이버 식별.” |
| 코드 명령 | ”/doc”, “/explain”, “/optimize”, “/test”, “/findTables” |
고급 프롬프트
7. MLOps 워크플로
| 시나리오 | 프롬프트 |
|---|---|
| 분류 모델 | ”@customer_data로 이탈 예측. target=‘churned’. 정확도+AUC. MLflow 기록.” |
| 회귀 모델 | ”@housing_prices로 가격 예측. 하이퍼파라미터 튜닝으로 오차 개선.” |
| 클러스터링 | ”@sales_leads로 고객 세그먼트 식별. 각 클러스터 특성 요약.” |
| 시계열 예측 | ”@incidents로 향후 2주 일별 사건 수 예측. 테이블 + 차트.” |
| 피처 엔지니어링 | ”범주형 인코딩, 결측치 처리, 스케일링, 피처 선택.” |
| 하이퍼파라미터 튜닝 | ”XGBoost를 Optuna로 50회 튜닝. 최적 파라미터 + 개선폭 보고.” |
| 모델 비교 | ”LR, RF, XGB, LGBM 4가지 비교. AUC/정밀도/재현율 표. 최적 모델 MLflow 등록.” |
고급 프롬프트
8. 모델 서빙 & 엔드포인트 관리
| 시나리오 | 프롬프트 |
|---|---|
| 헬스 체크 | ”이 엔드포인트 건강 상태 확인.” |
| 구성/스케일링 검토 | ”구성이 올바른지 / 스케일링 구성 검토.” |
| 배포 실패 진단 | ”/diagnose” 또는 “왜 배포 실패?” |
| 레이턴시 분석 | ”레이턴시 스파이크 분석” / “지난 24시간 성능 메트릭.” |
| 에러 패턴 | ”지난 주 에러 패턴 분석.” |
주의 모델 서빙의 Genie Code는 읽기 전용 어드바이저 입니다. Custom 엔드포인트에서만 지원됩니다.
9. GenAI / RAG 개발
| 시나리오 | 프롬프트 |
|---|---|
| RAG 체인 | ”@prod.docs.knowledge_base 기반 RAG. Vector Search → 프롬프트 → LLM → 응답. LangChain.” |
| 임베딩 생성 | ”@raw.documents text 컬럼 임베딩 생성 + Vector Search 인덱스 저장.” |
| 청킹 최적화 | ”여러 청킹 전략 비교(고정/문장/의미). 검색 품질 최적 전략 추천.” |
| 프롬프트 최적화 | ”RAG 시스템 프롬프트 개선. 환각 감소, 소스 인용, 모르면 모른다고.” |
| Trace/실패 분석 | ”tool calling 문제 trace 찾기” / “지난 주 실패 패턴.” |
| 평가 실행 | ”faithfulness, relevance, toxicity 평가. 저품질 케이스 원인 분류.” |
고급 프롬프트
10. Unity Catalog 작업
| 시나리오 | 프롬프트 |
|---|---|
| 테이블 생성 | ”Delta 테이블: customer_id(BIGINT), name(STRING), email, signup_date. Liquid Clustering.” |
| 뷰 생성 | ”@raw.orders + @raw.customers 조인 뷰. 한국어 COMMENT.” |
| 메타데이터 | ”@prod.sales 스키마 모든 테이블에 테이블/컬럼 설명 자동 생성.” |
| 테이블 검색 | ”/findTables 고객 구매 이력” |
| 최적화 | ”OPTIMIZE + VACUUM + Z-ORDER 추천.” |
| 리니지 | ”@gold.revenue_summary의 데이터 리니지 추적.” |