Managed vs External Volume 심화
두 Volume 유형의 선택은 데이터 관리 전략에 중요한 영향을 미칩니다.상세 비교
| 비교 항목 | Managed Volume | External Volume |
|---|---|---|
| 스토리지 위치 | UC Metastore의 기본 경로 하위에 자동 생성 | 사용자가 지정한 클라우드 스토리지 경로 |
| 스토리지 비용 | Databricks 관리 버킷에 포함 | 고객 클라우드 스토리지 비용 별도 발생 |
| 데이터 삭제 시 | Volume 삭제 시 데이터도 함께 삭제 | Volume 삭제해도 원본 데이터 유지 |
| 외부 접근 | Databricks를 통해서만 접근 | 클라우드 네이티브 도구(AWS CLI, azcopy)로도 접근 가능 |
| 기존 데이터 연결 | 불가 (새로 업로드 필요) | 기존 스토리지의 데이터를 그대로 연결 가능 |
| 권한 모델 | UC 권한만 적용 | UC 권한 + 클라우드 IAM 이중 체크 |
| Storage Credential | 불필요 | External Location + Storage Credential 필요 |
| 백업/복제 | Databricks가 관리하는 내구성 정책 | 고객이 클라우드 복제(Cross-Region 등) 직접 관리 |
External Volume 설정 과정
선택 가이드
| 상황 | 권장 유형 | 이유 |
|---|---|---|
| 새 프로젝트 | Managed | 설정이 간단하고 관리 부담이 없습니다 |
| 기존 S3/ADLS 데이터 | External | 데이터 이동 없이 거버넌스만 추가합니다 |
| 외부 시스템과 파일 교환 | External | 외부 도구에서도 직접 파일에 접근 가능합니다 |
| ETL 랜딩 존 | External | Auto Loader 등으로 외부에서 적재한 파일을 처리합니다 |
| 노트북 작업 파일 | Managed | 임시 파일, 실험 데이터 관리에 적합합니다 |
| 규제 데이터 | External | 데이터 위치를 고객이 명시적으로 제어해야 할 때 |