참고 학습 목표
- Databricks Agent 전략의 핵심 차별점(“데이터 중심 Agent”)을 설명할 수 있다
- Agent Bricks, Supervisor Agent, Mosaic AI Gateway, MLflow 3.0의 역할을 이해한다
- TAO/ALHF 자동 최적화가 기존 Agent 개발과 어떻게 다른지 설명할 수 있다
- 멀티클라우드 환경에서 Databricks Agent 아키텍처를 설계할 수 있다
성공 핵심 메시지: “Agent의 품질은 데이터의 품질에 의해 결정된다. Databricks는 데이터 준비에서 Agent 배포, 모니터링까지 전체 라이프사이클을 하나의 플랫폼에서 관리한다.”
1. 전략 개요 — 데이터 중심 Agent
Databricks의 근본적인 차별화:| 다른 벤더 | Databricks |
|---|---|
| Agent 빌딩 도구 제공 | Agent가 사용하는 데이터 까지 통합 관리 |
| 모델 API만 제공 | 데이터 전처리 → 임베딩 → Agent → 평가 전체 파이프라인 |
| 거버넌스는 별도 서비스 | Unity Catalog 하나로 데이터 + 모델 + Agent 거버넌스 통합 |
| Agent 품질은 수동 프롬프트 튜닝 | TAO/ALHF로 자동 최적화 |
| 특정 클라우드에 종속 | AWS, Azure, GCP 멀티클라우드 |
전략 스택
| 계층 | 구성 요소 | 역할 |
|---|---|---|
| 인터페이스 | Databricks Apps, Genie Code, Genie Space | 사용자/애플리케이션 접점 |
| Agent 빌드 (노코드) | Agent Bricks (KA, Genie Agent, Supervisor) | 코드 없이 Agent 구축 |
| Agent 빌드 (프로코드) | Agent Framework (ChatAgent, LangGraph 통합) | 코드 기반 Agent 개발 |
| 모델 관리 | Mosaic AI Gateway (멀티모델 라우팅, Fallback) | 모델 라우팅 및 폴백 |
| 배포 | Model Serving (서버리스, 자동 스케일링) | Agent 엔드포인트 배포 |
| 관측 | MLflow 3.0 (Tracing, Evaluate, Monitoring) | 추적, 평가, 모니터링 |
| 거버넌스 | Unity Catalog (데이터 + 모델 + Agent 거버넌스) | 통합 거버넌스 |
| 데이터 | Vector Search, Delta Lake, Lakebase | 데이터 저장 및 검색 |
2. Agent Bricks — 자동 최적화 Agent 빌더
Agent Bricks는 Databricks의 노코드 Agent 빌더 로, 2025년 6월 Data+AI Summit에서 GA되었습니다. 가장 혁신적인 기능은 TAO 와 ALHF 입니다.제품 구성
| 제품 | 설명 | 핵심 기능 |
|---|---|---|
| Knowledge Assistant | RAG 기반 Q&A Agent | Unity Catalog의 테이블/문서를 자동 인덱싱, 검색, 답변 |
| Genie Agent | 자연어 → SQL 변환 Agent | Genie Space를 Tool로 호출하여 데이터 분석 |
| Supervisor Agent | 멀티에이전트 오케스트레이터 | 하위 Agent들을 코드 없이 조율 |
TAO (Tool-Augmented Optimization)
기존 Agent 프레임워크에서 Agent의 Tool 선택 정확도를 높이려면 프롬프트를 수동으로 조정해야 합니다. TAO는 이를 자동화 합니다:- Agent가 도구를 호출할 때마다 성공/실패를 추적
- Tool 선택 패턴을 분석하여 전략을 자동 조정
- 도메인 특화 합성 데이터를 자동 생성하여 벤치마크 구축
참고 비유: TAO는 “Agent의 자동 코치”입니다. 매 경기(Tool 호출)를 분석하고, 전략(프롬프트)을 자동 개선합니다. 코치(프롬프트 엔지니어)가 직접 개입할 필요가 없습니다.
ALHF (Automated Learning from Human Feedback)
최종 사용자가 Agent 응답에 “좋아요/싫어요” 피드백을 남기면:- 좋아요: 해당 추론 경로(Tool 선택 → 응답 생성)가 강화
- 싫어요: 해당 추론 경로가 약화
성공 핵심 가치: 별도 Fine-tuning 파이프라인 없이, 프로덕션에서 Agent가 자동으로 개선 됩니다. RLHF의 엔터프라이즈 버전이라고 볼 수 있습니다.
3. Supervisor Agent — 노코드 멀티에이전트
Supervisor Agent는 Agent Bricks 내에서 코드 없이 멀티에이전트 시스템을 구축 할 수 있는 기능입니다.| 구성 요소 | 역할 | 설명 |
|---|---|---|
| Supervisor Agent | 오케스트레이터 | 사용자 요청을 분석하고 하위 Agent에 분배 |
| Knowledge Assistant | 문서 QA | RAG 기반 사내 문서 검색 및 답변 |
| Genie Agent | 데이터 분석 | 자연어 → SQL 변환, Genie Space 활용 |
| Custom Agent | API 연동 | 외부 API 호출, 커스텀 로직 실행 |
| Unity Catalog | 통합 거버넌스 | 모든 Agent의 데이터 접근 제어 및 리니지 추적 |
설정 과정
- 하위 Agent(Knowledge Assistant, Genie Agent 등)를 각각 생성
- Supervisor Agent 생성 시 하위 Agent를 “도구”로 등록
- 라우팅 규칙(자동/수동) 설정
- 평가 세트로 전체 시스템 품질 검증
- Model Serving Endpoint로 배포
연결 가능한 도구 유형
| 도구 유형 | 예시 |
|---|---|
| Knowledge Assistant | 사내 문서 Q&A, 규정 검색 |
| Genie Agent | 자연어 데이터 분석, BI 질의 |
| Agent Endpoint | 커스텀 Agent (ChatAgent/LangGraph) |
| Unity Catalog Function | SQL/Python 함수 직접 호출 |
| MCP Server | 외부 시스템 연동 (Slack, GitHub, JIRA 등) |
4. Mosaic AI Gateway — 멀티모델 관리
Mosaic AI Gateway는 Databricks의 중앙집중형 AI 모델 관리 계층 입니다.| 기능 | 설명 |
|---|---|
| 통합 엔드포인트 | OpenAI, Anthropic, AWS Bedrock, Azure OpenAI, 자체 모델을 하나의 API로 통합 |
| Rate Limiting | 사용자/팀별 토큰 할당량 관리 |
| Cost Tracking | 모델별, Agent별, 팀별 비용 추적 |
| Fallback | Primary 모델 장애 시 자동 Fallback (예: GPT-4o → Claude → Llama 4) |
| Guardrails | Unity Catalog 기반 입출력 필터링 |
| Audit Log | 모든 LLM 호출 이력을 Unity Catalog에 자동 기록 |
주의 왜 Gateway가 중요한가?멀티에이전트 시스템에서 각 Agent가 서로 다른 모델을 사용할 수 있습니다. Gateway 없이는:
- 비용 추적이 불가능 (어떤 Agent가 얼마나 소비하는지?)
- 모델 교체가 어려움 (코드 변경 필요)
- 거버넌스 사각지대 (어떤 데이터가 어떤 모델로 흘러갔는지?)
5. MLflow 3.0 — GenAI Observability
MLflow 3.0은 기존 ML 실험 추적 도구에서 GenAI/Agent 전문 관측 도구 로 진화했습니다.| 기능 | 설명 |
|---|---|
| Trace | Agent의 전체 실행 흐름을 시각화. Tool 호출, LLM 추론, 검색 결과를 트리 구조로 표시 |
| GenAI Metrics | 답변 정확도, 관련성, 충실도, 유해성 등 자동 평가 (@scorer 패턴) |
| Experiment Tracking | 프롬프트 버전, 모델 버전, Tool 구성 등을 실험 단위로 관리 |
| Prompt Registry | 프롬프트를 코드처럼 버전 관리, 팀 협업 |
| Model Registry | Agent를 버전 관리하고, 스테이지(Staging → Production)를 전환 |
| Production Monitoring | 배포 후 실시간 품질 드리프트 감지, 알럿 |
참고 MLflow 3.0의 Agent 추적 예시: Agent가 “지난 분기 매출 분석해줘”라는 요청을 처리할 때, Trace에서 다음을 확인할 수 있습니다:
- LLM이 요청을 분석한 추론 과정
- SQL 도구를 선택한 이유
- 실행된 SQL 쿼리와 결과
- 최종 응답 생성 과정
- 각 단계의 토큰 사용량과 지연시간
6. 멀티에이전트 아키텍처
Databricks의 멀티에이전트 전략은 “데이터 중심 오케스트레이션” 입니다.| 계층 | 구성 요소 | 역할 |
|---|---|---|
| 데이터 | Unity Catalog, Delta Lake, Vector Search | Agent가 사용하는 모든 데이터의 단일 소스 |
| 빌드 | Agent Bricks, Agent Framework, AI Dev Kit | 노코드/프로코드 Agent 개발 |
| 서빙 | Model Serving, Mosaic AI Gateway | 배포, 라우팅, 폴백 |
| 관측 | MLflow 3.0, Lakehouse Monitoring | 추적, 평가, 드리프트 감지 |
| 거버넌스 | Unity Catalog ACL, Audit Log | 권한, 감사, 리니지 |
다른 벤더와의 통합 패턴
Databricks는 모델 중립적이므로, 다른 벤더의 모델/서비스와 자연스럽게 결합됩니다:| 통합 패턴 | 설명 |
|---|---|
| OpenAI 모델 + Databricks | GPT-4.1/Claude를 Gateway 경유로 호출, Agent Bricks에서 백엔드 모델로 사용 |
| AWS Bedrock + Databricks | Bedrock 모델을 External Model로 등록, Unity Catalog 거버넌스 적용 |
| Llama 4 자체 호스팅 | Model Serving에 Llama 4 배포, 데이터 주권 확보 |
| LangGraph + Databricks | LangGraph로 복잡한 워크플로 구축, Databricks에서 배포/모니터링 |
| MCP + Genie Code | 외부 MCP 서버를 Genie Code에 연결, Unity Catalog Connection 경유 |
7. 차별점 요약 — 왜 Databricks인가?
| 차별점 | 설명 | 다른 벤더 대비 |
|---|---|---|
| 데이터-Agent 통합 | 데이터 준비에서 Agent 배포까지 하나의 플랫폼 | AWS/Azure는 데이터와 Agent 서비스가 분리 |
| Unity Catalog 거버넌스 | 데이터, 모델, Agent, Feature를 하나의 카탈로그로 관리 | 타 벤더는 데이터 거버넌스와 AI 거버넌스가 별도 |
| TAO/ALHF 자동 최적화 | 프로덕션에서 Agent가 자동으로 개선 | 타 벤더는 수동 프롬프트 튜닝 의존 |
| 모델 중립 | 어떤 Foundation Model이든 사용 가능 (Gateway 경유) | AWS는 Bedrock 모델 중심, MS는 OpenAI 중심 |
| MLflow 3.0 | 오픈소스 기반 GenAI 관측의 사실상 표준 | 타 벤더는 독자 모니터링 도구 |
| 멀티클라우드 | AWS, Azure, GCP 어디서든 동일한 Agent 경험 | AWS/Azure/GCP 각각 자사 클라우드 종속 |
8. 고객 시나리오별 권장 아키텍처
| 시나리오 | 권장 구성 | 이유 |
|---|---|---|
| 사내 문서 Q&A 챗봇 | Knowledge Assistant + Vector Search | 가장 빠른 구현, 노코드, UC 권한 자동 적용 |
| 데이터 분석 챗봇 | Genie Agent + SQL Warehouse | 자연어 → SQL, 기존 데이터 자산 활용 |
| 복합 업무 자동화 | Supervisor Agent (KA + Genie + Custom) | 문서 검색 + 데이터 분석 + API 호출 통합 |
| 코딩 에이전트 | Genie Code + MCP 서버 | GitHub, Slack, JIRA 연동 |
| 커스텀 Agent | ChatAgent + LangGraph + MLflow | 최대 유연성, 복잡한 워크플로 |
| 멀티클라우드 통합 | Gateway + Agent Bricks + MLflow | 클라우드 간 일관된 Agent 경험 |
9. 고객이 자주 묻는 질문
Q1: “Agent Bricks vs Agent Framework — 뭘 써야 하나요?”
참고
- Agent Bricks: 노코드, 빠른 구현, RAG/SQL/멀티에이전트의 표준 패턴에 적합. 대부분의 사용 사례는 여기서 해결.
- Agent Framework (ChatAgent): 코드 기반, 커스텀 로직이 필요한 경우. LangGraph 통합, 복잡한 조건 분기, 외부 API 연동.
- 권장: Agent Bricks로 시작 → 한계가 느껴지면 Agent Framework로 전환.
Q2: “Databricks가 모델도 만드나요? DBRX는?”
참고 DBRX는 Databricks가 만든 오픈웨이트 모델이지만, Databricks의 Agent 전략은 모델 중립 입니다. GPT-4.1, Claude, Gemini, Llama 4 등 어떤 모델이든 Gateway를 통해 사용할 수 있습니다.Databricks의 핵심 가치는 “최고의 모델을 만드는 것”이 아니라, “어떤 모델을 쓰든 데이터 거버넌스와 Agent 품질을 보장하는 것”입니다.
Q3: “MLflow 3.0은 LangSmith와 뭐가 다른가요?”
참고 | 비교 | MLflow 3.0 | LangSmith | |------|-----------|-----------| | 라이선스 | 오픈소스 | 상용 | | 프레임워크 | 프레임워크 무관 | LangChain/LangGraph 최적화 | | 데이터 거버넌스 | Unity Catalog 통합 | 없음 | | 실험 추적 | ML + GenAI 통합 | GenAI 전용 | | 모델 레지스트리 | 포함 | 없음 |LangGraph를 사용하더라도, Databricks 환경에서는 MLflow 3.0을 권장 합니다. Unity Catalog와의 통합으로 데이터 리니지까지 추적할 수 있습니다.
Q4: “타 벤더 Agent 플랫폼과 비교했을 때 Databricks를 선택해야 하는 결정적 이유는?”
참고 한 문장 요약: “Agent가 아무리 잘 만들어져도, 사용하는 데이터가 잘못되면 쓸모없다.”Databricks만이 데이터 준비(ETL) → 임베딩/벡터화 → Agent 개발 → 평가 → 배포 → 모니터링 → 거버넌스 전체를 하나의 플랫폼에서 관리합니다. 다른 벤더는 각 단계마다 다른 서비스를 조합해야 합니다. 특히 Unity Catalog 하나로 데이터 접근 제어, 모델 거버넌스, Agent 감사가 통합되는 것은 규제 환경(금융, 의료, 공공)에서 결정적 장점입니다.
10. 참고 자료
- Databricks Agent Bricks 문서
- Databricks Supervisor Agent
- Mosaic AI Gateway
- MLflow 3.0 GenAI
- Unity Catalog
- Databricks Agent Framework (ChatAgent)
- Agent Bricks TAO/ALHF (InfoQ)
- Mosaic AI Announcements at Data+AI Summit 2025
다음 단계
- Agent Bricks 상세 가이드: Knowledge Assistant, Genie Agent, Supervisor 구축 가이드
- Agent 프레임워크 생태계: LangGraph, CrewAI 등과의 비교
- Agent UI & 배포: Streamlit, Databricks Apps로 Agent 배포
- MCP 활용: Databricks 환경에서 MCP 서버 연동