주요 명령어
Workspace 관리
Workspace의 파일과 폴더를 관리합니다. 노트북, 파일, 디렉토리의 목록 조회, 내보내기, 가져오기가 가능합니다.클러스터 관리
클러스터의 생성, 시작, 정지, 상태 확인 등을 수행합니다.Job 관리
Lakeflow Jobs의 생성, 실행, 모니터링을 수행합니다.SQL 실행
SQL Warehouse를 통해 SQL 쿼리를 실행합니다.Volume 파일 관리
Unity Catalog Volume의 파일을 관리합니다. 로컬 파일을 업로드하거나, Volume에서 파일을 다운로드할 수 있습니다.Secrets 관리
비밀번호, API 키 등 민감한 정보를 안전하게 저장하고 관리합니다. Secrets는 노트북이나 Job에서 참조할 수 있지만, 평문으로 노출되지 않습니다.Asset Bundles
프로젝트를 코드로 정의하고, 환경별로 배포합니다. CI/CD 파이프라인의 핵심 도구입니다.유용한 옵션
| 옵션 | 설명 | 사용 예시 |
|---|---|---|
--profile <name> | 특정 인증 프로필 사용 | databricks clusters list --profile prod |
--output json | 결과를 JSON 형식으로 출력 | databricks jobs list --output json |
--output text | 결과를 텍스트 테이블로 출력 | databricks clusters list --output text |
--debug | 디버그 로그 출력 (문제 진단 시) | databricks clusters list --debug |
-h / --help | 도움말 표시 | databricks jobs --help |
--log-level | 로그 수준 설정 | databricks bundle deploy --log-level debug |
자주 사용하는 워크플로우
1. 개발 환경 빠른 설정
2. 프로덕션 배포 (CI/CD)
3. 대량 데이터 업로드
4. 클러스터 비용 관리
5. Job 실행 결과 모니터링
정리
| 핵심 기능 | 설명 |
|---|---|
| 설치 | Homebrew(macOS) 또는 curl(Linux/Windows)로 설치합니다. 레거시 CLI와 혼동하지 마세요 |
| 인증 | OAuth(권장) 또는 PAT 기반으로 설정합니다. CI/CD에서는 환경 변수를 사용합니다 |
| 프로필 | 여러 Workspace의 인증을 ~/.databrickscfg에서 프로필로 관리합니다 |
| Workspace | 노트북과 파일의 내보내기/가져오기를 수행합니다 |
| Clusters | 클러스터의 생성, 시작, 정지, 상태 조회를 수행합니다 |
| Jobs | Job의 생성, 실행, 모니터링, 파라미터 전달을 수행합니다 |
| Secrets | 민감한 정보를 암호화하여 안전하게 저장하고 관리합니다 |
| Asset Bundles | YAML로 프로젝트를 정의하고, 환경별로 배포합니다. CI/CD의 핵심입니다 |