Genie Code란?
Genie Code는 Databricks 노트북/콘솔에 내장된 AI 에이전트 입니다. 별도의 도구 설치 없이 Databricks 환경에서 바로 자연어로 코드를 생성하고 실행할 수 있습니다.Genie Code vs AI Dev Kit (Claude Code)
| Genie Code | AI Dev Kit (Claude Code) | |
|---|---|---|
| 설치 | 불필요 (Databricks 내장) | Claude Code + AI Dev Kit 설치 필요 |
| 사용 환경 | Databricks 노트북/콘솔 | 로컬 터미널/IDE |
| 장점 | 즉시 시작, Databricks 최적화 | 높은 커스터마이징, 다양한 도구 |
| 적합한 상황 | 노트북 내 빠른 작업 | 복잡한 프로젝트, 멀티파일 |
Genie Code 활성화
- Databricks 워크스페이스 접속
- 노트북 열기
- 셀 오른쪽 상단의 Genie Code 아이콘 클릭 (또는
Cmd+I/Ctrl+I) - 자연어로 요청 입력
Genie Code로 전체 파이프라인 한번에 생성
Genie Code의 ” Create pipeline with AI” 기능을 사용하면, 자연어 프롬프트 하나로 Bronze→Silver→Gold SDP 파이프라인 전체를 한번에 생성할 수 있습니다. 이 기능은 Track C (Genie Code)에서만 사용 가능 하며, Track A/B에서는 지원되지 않는 “one-shot pipeline” 기능입니다.** 참고:** 이 기능은 databricks/tmm Genie-Code-Lakeflow 데모에서 영감을 받았습니다.
단계별 플로우
- New > ETL Pipeline— Databricks 워크스페이스에서 새 ETL 파이프라인 생성을 시작합니다. 2.” Create pipeline with AI” 클릭 — AI 기반 파이프라인 생성 모드로 진입합니다.
- 자연어 프롬프트 입력— 원하는 파이프라인 구조를 자연어로 설명합니다.
- 아키텍처 리뷰— Genie Code가 제안하는 파이프라인 아키텍처(테이블 구조, 의존성 그래프)를 확인합니다.
- “ok” 입력— 아키텍처가 만족스러우면 승인합니다.
- 생성된 코드 리뷰— 각 테이블별 변환 로직, 데이터 품질 규칙 등을 검토합니다.
- Accept All— 모든 코드를 수락하여 파이프라인에 반영합니다.
- Run— 파이프라인을 실행하여 전체 데이터 처리를 수행합니다.
예시 프롬프트
** Track C만의 장점:** Track A (AI Dev Kit)나 Track B (AI Dev Kit + SDP)에서는 파이프라인 코드를 직접 작성하거나 모듈별로 나눠서 생성해야 합니다. Genie Code의 “Create pipeline with AI”는 전체 파이프라인을 한번에 설계하고 생성하는 유일한 방법입니다. 빠른 프로토타이핑이나 데모에 특히 유용합니다.
사용 방법
각 모듈별로 아래 프롬프트를 Genie Code 입력창 에 붙여넣기하세요. Genie Code가 코드를 자동 생성하고, “Apply” 버튼을 누르면 셀에 삽입됩니다.** Tip:** 생성된 코드를 검토한 후 실행하세요. 수정이 필요하면 다시 Genie Code에 요청하면 됩니다.
Module 1: Foundation & 데이터 생성
1-1. 카탈로그 & 스키마 생성
1-2. 디바이스 마스터 데이터 생성
1-3. 시청 로그 데이터 생성
1-4. 클릭 이벤트 데이터 생성
1-5. 광고 로그 데이터 생성
Module 2: Data Engineering
2-1. Silver 변환 (CTAS)
2-2. Gold 집계 (CTAS)
2-3. SDP 파이프라인
Module 3: AI/BI Dashboard & Genie
3-1. 심화 Gold 테이블 (대시보드용)
3-2. AI/BI Dashboard SQL 쿼리 검증
** Genie Code에서 대시보드 생성하기:**> Genie Code에 “위 쿼리들로 AI/BI 대시보드를 만들어줘. 대시보드 이름: SmartTV Analytics”라고 요청하면, Genie Code가 대시보드를 자동 구성합니다.
3-3. Genie Space 자연어 질문 실습
Genie Space는 별도로 UI에서 생성해야 합니다.
- Genie > New Genie Space 클릭
- Gold 테이블 8개 연결
- 아래 질문을 입력하며 실습
Module 4: Structured Streaming
4-1. Volume & Landing Zone
4-2. 이벤트 생성기
4-3. Auto Loader + SDP 스트리밍
Module 5: ML 추천 모델
5-1. 콘텐츠 메타데이터
5-2. ALS 추천 모델 학습
5-3. Vector Search
Module 6: GenAI & Agent Bricks
6-1. Knowledge Assistant
6-2. Genie Space Agent
6-3. Supervisor Agent
Module 7: Apps & Lakebase
7-1. Lakebase 생성
7-2. Databricks App 배포
7-3. Apps + Lakebase 연동
참고: Genie Code 프롬프트 작성 팁
좋은 프롬프트 패턴
- 목적 먼저: “~하는 코드를 작성해줘”
- 테이블 명시: 카탈로그.스키마.테이블 전체 경로
- 컬럼 구체적: 이름, 타입, 생성 규칙
- 변환 로직 명시: WHERE 조건, 파생 컬럼 공식
- 검증 요청: “생성 후 통계도 보여줘”
Genie Code가 잘하는 것
- SQL 쿼리 생성 (CTAS, 집계, 윈도우 함수)
- PySpark 코드 생성 (DataFrame API, ML)
- 데이터 생성 (가상 데이터, 테스트 데이터)
- 차트 생성 (matplotlib, plotly)
- 코드 설명 및 디버깅
Genie Code 한계 (AI Dev Kit이 더 나은 경우)
- 다중 파일 프로젝트 구성 (앱 배포 등)
- Databricks 외부 작업 (Git, 로컬 파일)
- 복잡한 워크플로우 오케스트레이션