최종 업데이트: 2026-04-08
Genie Code는 기본적으로 관리형 MCP 서버(Unity Catalog Functions, Vector Search, Genie Spaces, GitHub 등)를 통해 워크스페이스 리소스를 직접 조작합니다. 하지만 “어떻게 만들어야 하는가”에 대한 도메인 지식 — 예를 들어 메달리온 아키텍처 패턴, SDP 파이프라인 구성법, MLflow 평가 워크플로 같은 베스트 프랙티스 — 은 기본 제공되지 않습니다. AI Dev Kit 스킬 은 이 지식 갭을 채워줍니다. 30개 이상의
SKILL.md 파일이 Genie Code의 Agent 모드에 로드되어, 요청에 맞는 코드 패턴과 워크플로를 자동으로 안내합니다. MCP 서버가 Genie Code의 “손” (실행 능력)이라면, AI Dev Kit 스킬은 “머리” (도메인 지식)에 해당합니다.
참고 AI Dev Kit GitHub: databricks-solutions/ai-dev-kit
1. AI Dev Kit 스킬이란?
1.1 스킬의 본질
AI Dev Kit 스킬은SKILL.md 형태의 마크다운 지식 파일 입니다. 각 스킬에는 세 가지 핵심 요소가 포함됩니다.
| 구성 요소 | 역할 | 예시 |
|---|---|---|
| description | Genie Code가 언제 이 스킬을 로드할지 결정하는 매칭 키워드 | ”Delta Lake, Iceberg, UniForm, IRC 관련 작업” |
| instructions | 해당 도메인의 베스트 프랙티스, 권장 패턴, 코드 템플릿 | SDP 파이프라인에서 Bronze/Silver/Gold 테이블 구성법 |
| tools | 스킬이 참조하는 MCP 도구 목록 (선택사항) | execute_sql, create_or_update_pipeline |
1.2 기본 MCP 서버와의 차이
Genie Code의 기본 MCP 서버와 AI Dev Kit 스킬은 서로 다른 차원에서 동작합니다. 아래 표는 두 가지의 핵심 차이를 보여줍니다.| 구분 | Genie Code 기본 MCP 서버 | AI Dev Kit 스킬 |
|---|---|---|
| 성격 | 실행 도구 (API 호출, 데이터 조회) | 지식 가이드 (패턴, 베스트 프랙티스, 코드 예시) |
| 동작 방식 | Function Calling으로 직접 실행 | 컨텍스트로 로드되어 응답 품질 향상 |
| 제한 | MCP 도구 최대 20개 | 스킬 수 제한 없음 |
| 설치 | 자동 제공 (관리형) | 수동 설치 필요 |
| 업데이트 | Databricks가 관리 | 사용자가 install_skills.sh 재실행 |
create_or_update_pipeline API를 호출하여 파이프라인을 생성합니다.
1.3 기능 커버리지 비교
아래 표는 각 기능 영역에서 기본 MCP와 AI Dev Kit 스킬이 각각 무엇을 제공하는지 정리합니다.| 기능 영역 | Genie Code 기본 MCP | AI Dev Kit 스킬 |
|---|---|---|
| UC Functions | 관리형 도구 제공 | MCP 도구로 가이드 |
| Vector Search | 관리형 도구 제공 | 스킬로 가이드 |
| Genie Spaces | 관리형 도구 제공 | 스킬로 가이드 |
| Apps | 관리형 도구 제공 | 스킬로 가이드 |
| GitHub | UC Connection으로 제공 | — |
| 파이프라인 (SDP, Jobs, Streaming) | — | 스킬로 가이드 |
| 대시보드 (AI/BI) | — | 스킬로 가이드 |
| ML/Agent (MLflow, Agent Bricks, Model Serving) | — | 스킬로 가이드 |
| Iceberg / Lakebase | — | 스킬로 가이드 |
2. 설치 방법
2.1 사전 요구사항
AI Dev Kit 스킬을 설치하려면 Databricks CLI 가 로컬 환경에 설치되어 있고, 대상 워크스페이스에 인증이 설정되어 있어야 합니다.주의 Databricks CLI가 설치되어 있지 않다면, 공식 문서를 참고하여 먼저 설치하세요.pip install databricks-cli가 아닌 새로운 Databricks CLI (databricks명령어)가 필요합니다.
2.2 원클릭 설치 (권장)
레포를 클론하지 않고 스크립트를 직접 다운로드하여 실행하는 가장 간단한 방법입니다.- AI Dev Kit 레포에서 모든 스킬 파일(
SKILL.md)을 다운로드 - MLflow 스킬 레포(
mlflow/skills)에서 추가 스킬을 다운로드 - Databricks CLI를 사용하여
/Workspace/Users/<현재사용자>/.assistant/skills/경로에 업로드 - Genie Code 설정 > 스킬 목록에 자동 등록
2.3 레포 클론 후 설치
로컬에서 스킬 파일을 확인하거나 커스터마이징하고 싶다면 레포를 먼저 클론합니다.--local 플래그는 원격에서 다시 다운로드하지 않고 로컬 파일을 사용하도록 지시합니다.
2.4 특정 프로필 지정
여러 워크스페이스를 관리하는 경우--profile 옵션으로 대상 워크스페이스를 지정합니다.
2.5 설치 확인
설치가 완료되면 두 곳에서 확인할 수 있습니다. 방법 1: 워크스페이스 파일 탐색기 워크스페이스 좌측 패널에서Users > {내 이름} > .assistant > skills 경로를 열면 스킬 폴더가 나열됩니다. 각 폴더 안에 SKILL.md 파일이 있으면 정상입니다.
방법 2: Genie Code 설정 확인
- Genie Code 패널 상단의 톱니바퀴(Settings) 아이콘 클릭
- Skills 섹션에서 User skills 탭 확인
- 설치된 스킬 목록이 표시되면 정상
참고
스킬은 User 레벨 로 설치됩니다. 팀 전체에 공유하려면 설치 후 스킬 파일을 /Workspace/.assistant/skills/ (워크스페이스 루트)로 복사하면 Workspace 스킬 로 등록됩니다.
3. 스킬 전체 목록
AI Dev Kit에 포함된 30개 이상의 스킬을 카테고리별로 정리합니다. 각 스킬이 어떤 요청에 매칭되는지 이해하면, 프롬프트를 작성할 때 원하는 스킬이 로드되도록 유도할 수 있습니다.3.1 AI & Agent
AI 함수, 에이전트 구성, 모델 배포 등 GenAI 관련 작업을 지원하는 스킬입니다.| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| databricks-ai-functions | ai_classify, ai_extract, ai_summarize 등 내장 AI 함수 활용 | ”리뷰 데이터에서 감성 분류해줘” |
| databricks-agent-bricks | Knowledge Assistant, Genie Agent, Supervisor Agent 구성 | ”고객 문의 처리 에이전트를 만들어줘” |
| databricks-genie | Genie Space 생성, 쿼리, 설정 | ”매출 데이터용 Genie Space를 만들어줘” |
| databricks-model-serving | 모델/에이전트 서빙 엔드포인트 배포 | ”학습된 모델을 서빙 엔드포인트로 배포해줘” |
| databricks-vector-search | 벡터 인덱스 생성, RAG/시맨틱 검색 구성 | ”문서 기반 검색 시스템을 구축해줘” |
3.2 MLflow
실험 추적, 모델 평가, 에이전트 관측성 등 MLflow 생태계 스킬입니다. 이 스킬들은mlflow/skills 레포에서 가져옵니다.
| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| agent-evaluation | 에이전트/RAG 평가 워크플로 (correctness, groundedness 등) | “에이전트 응답 품질을 평가해줘” |
| instrumenting-with-mlflow-tracing | 기존 코드에 MLflow 트레이싱 추가 | ”이 체인에 트레이싱을 추가해줘” |
| mlflow-onboarding | MLflow 실험/모델 레지스트리 시작 가이드 | ”MLflow로 실험을 관리하고 싶어” |
| querying-mlflow-metrics | System Tables에서 메트릭 집계/분석 | ”지난달 모델 추론 메트릭을 분석해줘” |
| retrieving-mlflow-traces | 저장된 트레이스 검색 및 분석 | ”특정 요청의 트레이스를 찾아줘” |
| databricks-mlflow-evaluation | MLflow 기반 모델 평가 (분류, 회귀, LLM) | “모델 성능을 체계적으로 평가해줘” |
3.3 Analytics & Dashboard
데이터 분석 및 시각화 관련 스킬입니다.| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| databricks-aibi-dashboards | AI/BI 대시보드 생성 (SQL 검증, 레이아웃 구성 포함) | “매출 추이 대시보드를 만들어줘” |
| databricks-unity-catalog | 시스템 테이블 활용 (lineage, audit log, billing) | “테이블 리니지를 조회해줘” |
| databricks-metric-views | 비즈니스 메트릭 정의 및 관리 | ”월별 매출 메트릭을 정의해줘” |
| databricks-dbsql | SQL 기능 활용 (고급 SQL, 함수 등) | “윈도우 함수로 누적 합계를 구해줘” |
3.4 Data Engineering
데이터 파이프라인, 스트리밍, 인제스트 관련 스킬입니다.| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| databricks-spark-declarative-pipelines | SDP(Spark Declarative Pipelines, 구 DLT) 파이프라인 구성 | ”메달리온 아키텍처 파이프라인을 만들어줘” |
| databricks-jobs | Workflows 작업, 트리거, 스케줄 설정 | ”매일 새벽 3시에 ETL 실행되게 해줘” |
| databricks-spark-structured-streaming | 실시간 스트리밍 파이프라인 구성 | ”Kafka 스트림을 Delta 테이블로 수집해줘” |
| databricks-synthetic-data-gen | Faker 기반 테스트/합성 데이터 생성 | ”100만 건의 테스트 주문 데이터를 생성해줘” |
| databricks-iceberg | Iceberg 테이블, UniForm, Iceberg REST Catalog | ”Iceberg 테이블로 만들어줘” |
| databricks-zerobus-ingest | Zerobus 기반 데이터 인제스트 | ”S3에서 데이터를 자동으로 수집해줘” |
3.5 Development & Deployment
앱 개발, CI/CD, 인증, 데이터베이스 관련 스킬입니다.| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| databricks-bundles | DABs(Databricks Asset Bundles) 기반 CI/CD | ”번들로 프로젝트를 구성해줘” |
| databricks-app-python | Python 웹 앱 (Dash, Streamlit, Flask, Gradio) | “Streamlit 대시보드 앱을 만들어줘” |
| databricks-python-sdk | Python SDK, Databricks Connect, CLI 활용 | ”Python SDK로 클러스터를 관리해줘” |
| databricks-config | 프로필 인증 설정 및 관리 | ”Databricks 인증을 설정해줘” |
| databricks-lakebase-provisioned | Lakebase 관리형 PostgreSQL 설정 | ”Lakebase 데이터베이스를 생성해줘” |
| databricks-lakebase-autoscale | Lakebase 오토스케일링 구성 | ”Lakebase를 오토스케일 모드로 설정해줘” |
3.6 Reference
문서 인덱스 등 범용 참조 스킬입니다.| 스킬 이름 | 용도 | 매칭되는 요청 예시 |
|---|---|---|
| databricks-docs | Databricks 공식 문서 인덱스 (llms.txt 기반) | 모든 요청에서 공식 문서 참조 시 자동 활용 |
install_skills.sh를 재실행하면 새로 추가된 스킬도 자동으로 설치됩니다.
4. 활용 예시
4.1 자동 매칭 (Agent 모드)
Genie Code의 Agent 모드에서는 사용자의 요청 내용을 분석하여 관련 스킬의description과 매칭한 후 자동으로 로드합니다. 별도의 조작 없이 자연스러운 대화로 스킬이 활성화됩니다.
예시 1: 데이터 파이프라인 구축
databricks-spark-structured-streaming— 실시간 수집 패턴databricks-spark-declarative-pipelines— 메달리온 아키텍처 SDP 구성databricks-jobs— 파이프라인 스케줄링
databricks-aibi-dashboards— 대시보드 레이아웃 및 SQL 검증databricks-dbsql— 분석 SQL 패턴
databricks-model-serving— 엔드포인트 배포 패턴databricks-mlflow-evaluation— 모델 평가 워크플로querying-mlflow-metrics— 메트릭 모니터링 쿼리
4.2 수동 호출 (@멘션)
자동 매칭이 원하는 스킬을 로드하지 않을 때는@ 기호로 직접 지정할 수 있습니다.
참고
@ 멘션은 해당 스킬을 강제 로드 합니다. 자동 매칭과 달리 description이 일치하지 않아도 로드됩니다. 특정 스킬의 지식이 반드시 필요한 경우에 유용합니다.
5. 스킬 동작 메커니즘
5.1 로드 과정
스킬이 실제로 어떻게 동작하는지 이해하면 더 효과적으로 활용할 수 있습니다.- 요청 분석 — 사용자가 프롬프트를 입력하면 Genie Code가 요청 의도를 파악합니다.
- 스킬 매칭 — 설치된 모든 스킬의
description필드와 요청 내용을 비교하여 관련 스킬을 선별합니다. - 컨텍스트 주입 — 매칭된 스킬의
instructions내용이 Genie Code의 컨텍스트에 추가됩니다. - 응답 생성 — 확장된 컨텍스트를 바탕으로 코드, 설명, 실행 계획을 생성합니다.
- 도구 실행 — 필요한 경우 MCP 도구를 호출하여 실제 작업을 수행합니다.
5.2 스킬과 MCP 도구의 관계
스킬과 MCP 도구는 별개의 메커니즘입니다. 이 구분이 중요합니다.| 항목 | MCP 도구 | 스킬 |
|---|---|---|
| 제한 | 세션당 최대 20개 | 제한 없음 |
| 동작 | Function Calling으로 API 호출 | 컨텍스트로 지식 주입 |
| 설정 위치 | Genie Code 설정 > MCP 서버 | Genie Code 설정 > 스킬 |
| 모드 | Agent 모드 전용 | Agent 모드 전용 |
6. 커스텀 스킬 작성
6.1 왜 커스텀 스킬인가?
AI Dev Kit의 기본 스킬은 Databricks 플랫폼의 범용 베스트 프랙티스를 제공합니다. 하지만 실제 업무에서는 조직 고유의 네이밍 규칙, 데이터 모델, 파이프라인 패턴이 있습니다. 커스텀 스킬을 만들면 이러한 조직 특화 지식 을 Genie Code에 주입할 수 있습니다.6.2 SKILL.md 템플릿
주의사항
- PII 컬럼은 반드시
ai_mask()함수로 마스킹 - 일별 파이프라인은 KST 기준 새벽 2시 실행
주의 Workspace 스킬은 해당 워크스페이스의 모든 Genie Code 사용자 에게 자동 적용됩니다. 조직 전체에 영향을 미치므로 배포 전 충분한 검토가 필요합니다.
7. 주의사항 & 트러블슈팅
7.1 Agent 모드 필수
AI Dev Kit 스킬은 Agent 모드에서만 동작합니다. Edit 모드나 Chat 모드에서는 스킬이 로드되지 않습니다. Genie Code 프롬프트 입력창 좌측에서 모드가 Agent로 설정되어 있는지 확인하세요.7.2 스킬이 자동 로드되지 않을 때
스킬의description 필드가 사용자의 요청과 충분히 매칭되지 않으면 자동 로드가 실패할 수 있습니다. 이 경우 두 가지 해결 방법이 있습니다.
- @멘션으로 강제 로드:
@databricks-iceberg처럼 스킬 이름을 직접 지정 - 프롬프트에 키워드 추가: description에 포함된 키워드를 프롬프트에 명시적으로 포함
7.3 스킬 업데이트
AI Dev Kit은 지속적으로 업데이트됩니다. 최신 스킬을 받으려면 설치 스크립트를 다시 실행하세요.7.4 스킬 비활성화
특정 스킬이 불필요하거나 의도치 않게 로드되는 경우, 해당 스킬 폴더를 워크스페이스에서 삭제하면 됩니다.7.5 설치 실패 시
설치 스크립트가 실패하는 주요 원인과 해결 방법입니다.| 증상 | 원인 | 해결 |
|---|---|---|
databricks: command not found | Databricks CLI 미설치 | curl -fsSL https://raw.githubusercontent.com/databricks/setup-cli/main/install.sh | sh |
Error: auth: cannot configure default credentials | 인증 미설정 | databricks auth login --host https://<workspace-url> |
Error: Path already exists | 이전 설치 잔재 | --install-to-genie 플래그가 자동 덮어쓰기 처리 |
| 일부 스킬만 설치됨 | 네트워크 타임아웃 | 스크립트 재실행 (멱등성 보장) |
참고 스킬 설치 스크립트는 멱등(idempotent) 합니다. 여러 번 실행해도 동일한 결과를 보장하므로, 문제가 발생하면 안심하고 재실행하세요.
8. 정리
AI Dev Kit 스킬은 Genie Code를 단순한 코드 생성 도구에서 Databricks 전문가 수준의 AI 어시스턴트 로 업그레이드합니다. 핵심 포인트를 요약합니다.| 항목 | 요약 |
|---|---|
| 설치 | curl 한 줄로 30개+ 스킬 일괄 설치 |
| 동작 | Agent 모드에서 요청에 따라 자동 로드 |
| 역할 | 기본 MCP(실행)를 보완하는 도메인 지식(가이드) |
| 커스텀 | SKILL.md 작성으로 조직 맞춤 지식 추가 |
| 업데이트 | install_skills.sh 재실행으로 최신 버전 유지 |
| 제한 | Agent 모드 전용, MCP 도구 제한과는 별개 |