Skip to main content
Marketplace 구독부터 PrivateLink까지, AWS Console 기반으로 Databricks Workspace를 처음부터 구성하는 전체 가이드입니다.
슬라이드 버전: AWS Workspace 구성 가이드 (웹 슬라이드)
https://simyungyang.github.io/databricks-enablement-blog/aws-workspace-setup.html

대상

  • AWS에 Databricks를 신규 도입하는 고객
  • PrivateLink(프라이빗 연결) 구성이 필요한 엔터프라이즈 고객

목차

#단계설명
0Databricks on AWS 아키텍처Control Plane / Compute Plane 구조, PrivateLink 아키텍처
1AWS Marketplace 구독Marketplace vs Direct 계약, 기존 계정 연결
2사전 준비IAM 권한, STS 엔드포인트, Enterprise 티어
3Credential 구성Cross-Account IAM Role — Trust Policy, Permission Policy
4Storage 구성Root S3 Bucket, Bucket Policy
5Network 구성VPC, Private Subnet, Security Group, AWS Service Endpoints
6Backend PrivateLinkVPC Endpoint (REST API + SCC Relay), Private Access Settings
7Frontend PrivateLink (옵션)Transit VPC, Route 53 DNS, Inbound Resolver
8Workspace 생성Account Console에서 프로비저닝
9Unity CatalogUC Metastore + Storage Credential + File Events IAM
10Serverless NCCServerless Compute 네트워크 제어
11기존 WS에 PrivateLink 추가운영 중 Workspace에 PrivateLink 사후 적용
ATerraform 자동화IaC 전환 참고 (Appendix)

Databricks on AWS 아키텍처

전체 아키텍처 — Control Plane + Compute Plane 분리 구조

Databricks on AWS Architecture 출처: Databricks High-Level Architecture

Control Plane vs Compute Plane

항목Control Plane (Databricks 관리)Compute Plane (고객 AWS 계정)
위치Databricks AWS 계정고객 AWS 계정 VPC
구성요소Web UI, REST API, Cluster ManagerEC2 인스턴스 (클러스터 노드)
데이터Notebook, Unity Catalog 메타데이터DBFS Root Storage (S3), 고객 데이터
역할오케스트레이션, IAM실제 연산 수행, 데이터 접근
참고 핵심: 고객 데이터는 고객 AWS 계정 에 머무름 — Control Plane은 메타데이터와 오케스트레이션만 담당
참고: Databricks Concepts

Classic vs Serverless Workspace

항목Classic WorkspaceServerless Workspace
Compute 위치고객 VPC 내 EC2Databricks 관리 VPC
고객 구성IAM Role, S3, VPC, SG 직접 구성구성 불필요
네트워크 제어완전 제어 가능NCC로 관리
PrivateLink구성 가능 (Backend + Frontend)NCC 기반 별도 구성
적합 시나리오프로덕션, 보안 요건PoC, 빠른 시작
참고 이 가이드는 Classic Workspace 구성 을 다룹니다 — 고객이 AWS 리소스를 직접 구성하는 방식

Serverless Workspace 아키텍처

Serverless Workspace Architecture 출처: Serverless Compute Overview

Workspace 구성에 필요한 AWS 리소스

Classic Workspace 기준 — 고객이 준비해야 할 것:
분류AWS 리소스용도Databricks 등록
IAMCross-Account IAM RoleEC2 프로비저닝 권한 위임Credential Configuration
IAMUC Storage IAM RoleUnity Catalog 데이터 접근Storage Credential
S3Root Storage BucketDBFS 워크스페이스 데이터Storage Configuration
S3UC Managed Storage BucketUnity Catalog 관리 데이터External Location
VPCVPC + Private Subnet x2Databricks 클러스터 실행Network Configuration
VPCPublic Subnet + NAT GW아웃바운드 인터넷 접근
VPCSecurity Group클러스터 통신 포트 제어Network Configuration
VPCVPC Endpoints (PrivateLink)프라이빗 연결VPC Endpoint
KMSCustomer Managed Key (선택)노트북/DBFS 암호화CMK Configuration
참고: Create a workspace using the account console Compute Plane → Control Plane 프라이빗 연결: Backend PrivateLink Architecture 출처: PrivateLink Concepts — Classic Compute 사용자 → Workspace 프라이빗 접근: Frontend PrivateLink Architecture 출처: PrivateLink Concepts — Front-End

구성 단계 전체 흐름

AWS Console + Databricks Account Console 매핑:
단계AWS Console 작업Databricks Account Console 등록참고 문서
1. CredentialIAM Role + Policy 생성Cloud resources → Credential configurationDocs
2. StorageS3 Bucket + Policy 생성Cloud resources → Storage configurationDocs
3. VPC/Subnet/SGVPC + Subnets + SG 생성AWS Console (VPC)Docs
4. VPC EndpointsPrivateLink Endpoint 생성AWS Console + Security → Networking → VPC endpointsDocs
5. NetworkEndpoint 포함 Network 등록Security → Networking → Classic network configurationsDocs
6. AccessPrivate Access 설정Security → Networking → Private access settingsDocs
7. WorkspaceWorkspace 생성Workspaces → Create workspaceDocs