에이전트 도구(Tools)와 UC 함수

에이전트 도구란?

AI 에이전트가 외부 세계와 상호작용하려면 도구(Tool) 가 필요합니다. 도구는 에이전트가 호출할 수 있는 함수로, 데이터 조회, API 호출, 계산 수행 등의 작업을 수행합니다. Databricks에서는 Unity Catalog 함수 를 에이전트 도구로 활용하여, 기존 거버넌스 체계(권한, 감사, 리니지)를 그대로 적용할 수 있습니다.

💡 비유: 에이전트가 “두뇌(LLM)“라면, 도구는 “손(Tool)“입니다. 두뇌가 아무리 똑똑해도, 손이 없으면 문서를 검색하거나 주문을 확인할 수 없습니다.

도구 유형

Databricks Agent Framework에서 사용할 수 있는 도구 유형은 다음과 같습니다.

도구 유형	설명	적합한 사용 사례
SQL 함수	SQL로 정의된 UC 함수입니다	데이터 조회, 집계, 검색
Python 함수	Python으로 정의된 UC 함수입니다	외부 API 호출, 복잡한 로직
Retriever 도구	Vector Search 기반 문서 검색입니다	RAG 패턴, 문서 Q&A
기존 엔드포인트	Model Serving 엔드포인트를 도구로 사용합니다	임베딩 생성, 분류 등

SQL 도구 (SQL Function Tool)

데이터 조회 도구

-- 주문 상태 조회 도구
CREATE OR REPLACE FUNCTION catalog.schema.get_order_status(
    order_id BIGINT COMMENT '조회할 주문번호'
)
RETURNS TABLE(order_id BIGINT, status STRING, shipping_date DATE, estimated_arrival DATE)
COMMENT '주문번호로 현재 주문 상태와 배송 정보를 조회합니다. 주문 상태가 궁금하거나 배송 정보를 확인할 때 사용하세요.'
RETURN
    SELECT order_id, status, shipping_date, estimated_arrival
    FROM catalog.schema.orders
    WHERE order_id = get_order_status.order_id;

집계 도구

-- 고객별 최근 주문 요약 도구
CREATE OR REPLACE FUNCTION catalog.schema.get_customer_summary(
    customer_email STRING COMMENT '고객 이메일 주소'
)
RETURNS TABLE(name STRING, tier STRING, total_orders INT, lifetime_value DECIMAL(12,2), last_order_date DATE)
COMMENT '이메일로 고객 정보와 주문 요약을 조회합니다. 고객 문의 시 기본 정보를 확인하는 데 사용하세요.'
RETURN
    SELECT
        c.name,
        c.tier,
        COUNT(o.order_id) AS total_orders,
        SUM(o.amount) AS lifetime_value,
        MAX(o.order_date) AS last_order_date
    FROM catalog.schema.customers c
    LEFT JOIN catalog.schema.orders o ON c.customer_id = o.customer_id
    WHERE c.email = get_customer_summary.customer_email
    GROUP BY c.name, c.tier;

💡 COMMENT가 매우 중요합니다. LLM은 함수의 COMMENT를 읽고 “이 도구를 언제 사용해야 하는지” 판단합니다. COMMENT에 도구의 목적, 사용 시나리오, 입력 형식을 상세히 기술하세요.

Python 도구 (Python Function Tool)

외부 API 호출, 이메일 발송, 복잡한 계산 등 SQL로 구현하기 어려운 로직에 사용합니다.

-- 외부 날씨 API 호출 도구
CREATE OR REPLACE FUNCTION catalog.schema.get_weather(
    city STRING COMMENT '날씨를 조회할 도시 이름 (예: Seoul, Busan)'
)
RETURNS STRING
LANGUAGE PYTHON
COMMENT '도시의 현재 날씨 정보를 조회합니다. 배송 예상이나 야외 이벤트 관련 질문에 사용하세요.'
AS $$
    import requests

    response = requests.get(
        f"https://api.weatherapi.com/v1/current.json",
        params={"key": "API_KEY", "q": city}
    )
    if response.ok:
        data = response.json()
        current = data["current"]
        return f"{city}: {current['temp_c']}°C, {current['condition']['text']}"
    else:
        return f"날씨 정보를 가져올 수 없습니다: {response.status_code}"
$$;

-- 이메일 발송 도구
CREATE OR REPLACE FUNCTION catalog.schema.send_notification(
    recipient_email STRING COMMENT '수신자 이메일 주소',
    subject STRING COMMENT '이메일 제목',
    body STRING COMMENT '이메일 본문'
)
RETURNS STRING
LANGUAGE PYTHON
COMMENT '고객에게 이메일 알림을 발송합니다. 주문 확인, 배송 알림 등에 사용하세요.'
AS $$
    import requests

    response = requests.post(
        "https://api.company.com/notify",
        json={"to": recipient_email, "subject": subject, "body": body},
        headers={"Authorization": "Bearer TOKEN"}
    )
    return f"발송 {'성공' if response.ok else '실패'}: {recipient_email}"
$$;

Retriever 도구 (Vector Search 기반)

RAG 패턴에서 사용되는 문서 검색 도구입니다. Vector Search Index를 활용하여 의미적으로 관련된 문서를 검색합니다.

from databricks.agents.tools import VectorSearchRetrieverTool

# Vector Search 기반 Retriever 도구
retriever_tool = VectorSearchRetrieverTool(
    index_name="catalog.schema.docs_index",
    num_results=5,
    columns=["content", "title", "source_url"],
    query_type="ANN",  # Approximate Nearest Neighbor
    tool_description="회사 내부 문서, FAQ, 제품 매뉴얼에서 관련 정보를 검색합니다. 고객 질문에 답변하기 위한 정보가 필요할 때 사용하세요."
)

UCFunctionToolkit

UCFunctionToolkit 은 Unity Catalog 함수들을 에이전트 도구로 일괄 등록하는 유틸리티입니다.

from databricks.agents.tools import UCFunctionToolkit

# UC 함수들을 도구 목록으로 변환
toolkit = UCFunctionToolkit(
    function_names=[
        "catalog.schema.get_order_status",
        "catalog.schema.get_customer_summary",
        "catalog.schema.send_notification",
    ]
)

# 도구 목록 확인
for tool in toolkit.tools:
    print(f"Tool: {tool.name}")
    print(f"  Description: {tool.description}")
    print(f"  Parameters: {tool.parameters}")
    print()

LangChain과 연동

from databricks.agents.tools import UCFunctionToolkit
from langchain_community.chat_models import ChatDatabricks
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain_core.prompts import ChatPromptTemplate

# 1. UC 함수를 LangChain 도구로 변환
toolkit = UCFunctionToolkit(
    function_names=[
        "catalog.schema.get_order_status",
        "catalog.schema.get_customer_summary",
    ]
)
tools = toolkit.tools

# 2. LLM 설정
llm = ChatDatabricks(
    endpoint="databricks-meta-llama-3-3-70b-instruct",
    temperature=0.1
)

# 3. 프롬프트 설정
prompt = ChatPromptTemplate.from_messages([
    ("system", "당신은 고객 지원 에이전트입니다. 제공된 도구를 사용하여 정확하게 답변하세요."),
    ("placeholder", "{chat_history}"),
    ("human", "{input}"),
    ("placeholder", "{agent_scratchpad}")
])

# 4. 에이전트 생성 및 실행
agent = create_tool_calling_agent(llm, tools, prompt)
executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 5. 실행
response = executor.invoke({"input": "주문 12345의 상태를 알려주세요", "chat_history": []})
print(response["output"])

도구 호출 흐름

단계	발신	수신	내용
1	사용자	에이전트 (LLM)	“주문 12345 상태를 알려주세요”
2	에이전트	(내부 처리)	의도 분석: 주문 상태 조회 필요
3	에이전트	도구 (UC 함수)	`get_order_status(order_id=12345)` 호출
4	도구	데이터 (Delta Table)	`SELECT * FROM orders WHERE order_id=12345` 실행
5	데이터	도구	`{status: "배송중", estimated_arrival: "2025-04-02"}` 반환
6	도구	에이전트	조회 결과 반환
7	에이전트	(내부 처리)	결과를 자연어로 변환
8	에이전트	사용자	”주문 12345는 현재 배송 중이며, 4월 2일 도착 예정입니다.”

도구 설계 Best Practices

원칙	설명
명확한 COMMENT	함수의 목적, 사용 시기, 입력 형식을 상세히 기술하세요
파라미터 COMMENT	각 파라미터에도 설명을 추가하여 LLM이 올바른 값을 전달하도록 하세요
단일 책임	하나의 도구는 하나의 작업만 수행하세요 (조회와 수정을 분리)
에러 처리	잘못된 입력에 대해 명확한 에러 메시지를 반환하세요
최소 권한	도구가 접근하는 데이터의 범위를 최소화하세요
성능	도구의 응답 시간이 길면 에이전트 전체 응답이 느려집니다

실전 인사이트: 도구를 10개 이상 등록하면 에이전트가 혼란스러워집니다

프로덕션 에이전트를 운영하면서 가장 많이 겪는 실수가 “도구를 너무 많이 등록하는 것”입니다. 처음에는 “도구가 많으면 더 많은 질문에 답할 수 있겠지”라고 생각하지만, 실제로는 정반대입니다.

도구 수에 따른 에이전트 성능 변화 (실측)

도구 수	올바른 도구 선택률	평균 응답 시간	비고
3~5개	95%+	2~3초	최적. 도구 간 역할이 명확
6~8개	85~90%	3~5초	양호. COMMENT를 정교하게 쓰면 유지 가능
10~15개	60~75%	5~8초	위험 구간. 유사한 도구끼리 혼동 시작
20개+	40~50%	8초+	사실상 사용 불가. 엉뚱한 도구를 호출하거나 도구 선택을 포기

⚠️ 실전 경험: 고객지원 에이전트에 get_order_status, get_order_details, get_order_history, get_order_tracking을 모두 등록했더니, LLM이 “주문 상태 알려줘”라는 질문에 4개 중 어떤 도구를 쓸지 매번 다르게 선택했습니다. 이름이 비슷한 도구는 하나로 합치거나, COMMENT에서 “이 도구는 X 상황에서만 사용하세요. Y 상황에서는 Z 도구를 사용하세요”라고 명확히 구분해야 합니다.

도구가 많아질 때 대처법

전략	설명
도구 그룹핑	관련 도구를 하나의 “슈퍼 도구”로 합칩니다. 파라미터로 동작을 분기합니다
멀티 에이전트	도메인별로 에이전트를 분리합니다 (주문 에이전트, 배송 에이전트, 결제 에이전트)
라우터 패턴	첫 번째 에이전트가 질문을 분류하고, 해당 도메인 에이전트로 라우팅합니다
도구 설명 최적화	도구 수를 줄일 수 없다면, COMMENT를 극도로 정교하게 작성합니다

실전 인사이트: 도구 설명(Description)이 프롬프트 엔지니어링보다 중요합니다

많은 팀이 시스템 프롬프트를 정교하게 작성하는 데 시간을 쏟지만, 정작 도구의 COMMENT를 대충 작성 합니다. 실전에서는 시스템 프롬프트보다 도구 설명이 에이전트 동작에 훨씬 큰 영향을 미칩니다.

나쁜 COMMENT vs 좋은 COMMENT

-- ❌ 나쁜 예: LLM이 언제 이 도구를 써야 하는지 판단하기 어렵습니다
CREATE FUNCTION get_info(id BIGINT)
RETURNS TABLE(...)
COMMENT '정보를 조회합니다'
...

-- ✅ 좋은 예: LLM이 정확히 언제, 어떤 입력으로 호출해야 하는지 알 수 있습니다
CREATE FUNCTION get_order_status(order_id BIGINT COMMENT '주문번호 (숫자, 예: 12345)')
RETURNS TABLE(order_id BIGINT, status STRING, shipping_date DATE)
COMMENT '주문번호로 현재 배송 상태를 조회합니다.
고객이 "내 주문 어디 있어?", "배송 언제 오나요?", "주문 상태 확인" 등의
질문을 할 때 이 도구를 사용하세요.
반품이나 환불 관련 질문에는 이 도구가 아닌 get_return_status를 사용하세요.
order_id를 모르는 경우, 먼저 get_customer_orders 도구로 주문 목록을 조회하세요.'
...

💡 핵심 원칙: COMMENT에는 (1) 이 도구가 하는 일, (2) 이 도구를 사용해야 하는 상황, (3) 이 도구를 사용하면 안 되는 상황, (4) 입력값을 모를 때 어떻게 해야 하는지를 모두 포함하세요. COMMENT가 길어지는 것을 두려워하지 마세요. LLM은 긴 설명을 잘 읽습니다.

실전 인사이트: UC 함수의 실행 권한이 에이전트 보안의 핵심입니다

에이전트가 UC 함수를 도구로 호출할 때, 누구의 권한으로 실행되는지 가 매우 중요합니다. 이 부분을 간과하면 심각한 보안 사고로 이어질 수 있습니다.

에이전트 실행 권한 모델

배포 방식	실행 권한	보안 수준	설명
개발 중 (노트북)	개발자 본인	낮음	개발자의 모든 권한으로 실행. 프로덕션에서 절대 사용 금지
Model Serving (서비스 프린시펄)	서비스 프린시펄	높음	에이전트 전용 서비스 프린시펄에 최소 권한만 부여
Apps (사용자 토큰)	최종 사용자	매우 높음	사용자별 권한이 적용되어 가장 안전

실전 보안 체크리스트

-- 1. 에이전트 전용 서비스 프린시펄 생성
-- (Databricks Account Console에서 수행)

-- 2. 필요한 함수에만 EXECUTE 권한 부여
GRANT EXECUTE ON FUNCTION catalog.schema.get_order_status
  TO `agent-service-principal`;
GRANT EXECUTE ON FUNCTION catalog.schema.get_customer_summary
  TO `agent-service-principal`;

-- 3. 데이터 테이블에는 SELECT만 부여 (INSERT/UPDATE/DELETE 절대 금지)
GRANT SELECT ON TABLE catalog.schema.orders
  TO `agent-service-principal`;

-- 4. 위험한 함수(삭제, 이메일 발송 등)는 별도 승인 프로세스 구축
-- → Human-in-the-loop 패턴으로 사용자 확인 후 실행

⚠️ 절대 하면 안 되는 것: 에이전트 서비스 프린시펄에 ALL PRIVILEGES를 부여하거나, 카탈로그/스키마 수준의 광범위한 권한을 주는 것입니다. 에이전트는 LLM이 판단하는 대로 함수를 호출하므로, 프롬프트 인젝션(Prompt Injection) 공격으로 의도하지 않은 함수가 호출될 수 있습니다. 최소 권한 원칙을 반드시 지키세요.

위험한 도구에 대한 Human-in-the-Loop 패턴

데이터를 변경 하는 도구(주문 취소, 환불 처리, 이메일 발송 등)는 에이전트가 자동으로 실행하면 안 됩니다. 반드시 사용자에게 확인을 받는 패턴을 구현해야 합니다.

# Human-in-the-loop 패턴 예시
def cancel_order_with_confirmation(order_id: int) -> str:
    """주문을 취소합니다. 실행 전 사용자 확인이 필요합니다."""

    # 1단계: 주문 정보를 조회하여 사용자에게 보여줌
    order_info = get_order_details(order_id)

    # 2단계: 확인 메시지 반환 (실제 취소는 하지 않음)
    return (
        f"주문 {order_id} ({order_info['product_name']}, "
        f"{order_info['amount']}원)을 취소하시겠습니까? "
        f"확인하시면 '네, 취소해주세요'라고 말씀해주세요."
    )
    # 3단계: 사용자가 확인하면 별도 confirm_cancel_order 도구가 실행됨

정리

핵심 개념	설명
UC 함수를 도구로	Unity Catalog의 SQL/Python 함수를 에이전트 도구로 활용합니다
SQL 도구	데이터 조회, 집계에 적합합니다. RETURNS TABLE로 테이블 반환이 가능합니다
Python 도구	외부 API 호출, 복잡한 로직에 적합합니다
Retriever 도구	Vector Search 기반 RAG 문서 검색을 수행합니다
UCFunctionToolkit	UC 함수들을 에이전트 도구로 일괄 변환하는 유틸리티입니다
COMMENT의 중요성	LLM이 도구 선택과 파라미터 결정에 COMMENT를 참고합니다

Databricks 플랫폼

레이크하우스 아키텍처

컴퓨트

데이터 엔지니어링

데이터 웨어하우징

Unity Catalog

AI/BI

머신러닝

AI 에이전트

Lakebase

보안과 거버넌스

모범 사례

개발 도구

부록 — 선행 지식

부록 — 데이터 기초

부록 — 참고

에이전트 도구란?

도구 유형

SQL 도구 (SQL Function Tool)

데이터 조회 도구

집계 도구

Python 도구 (Python Function Tool)

Retriever 도구 (Vector Search 기반)

UCFunctionToolkit

LangChain과 연동

도구 호출 흐름

도구 설계 Best Practices

실전 인사이트: 도구를 10개 이상 등록하면 에이전트가 혼란스러워집니다

도구 수에 따른 에이전트 성능 변화 (실측)

도구가 많아질 때 대처법

실전 인사이트: 도구 설명(Description)이 프롬프트 엔지니어링보다 중요합니다

나쁜 COMMENT vs 좋은 COMMENT

실전 인사이트: UC 함수의 실행 권한이 에이전트 보안의 핵심입니다

에이전트 실행 권한 모델

실전 보안 체크리스트

위험한 도구에 대한 Human-in-the-Loop 패턴

정리

참고 링크

Databricks 플랫폼

레이크하우스 아키텍처

컴퓨트

데이터 엔지니어링

데이터 웨어하우징

Unity Catalog

AI/BI

머신러닝

AI 에이전트

Lakebase

보안과 거버넌스

모범 사례

개발 도구

부록 — 선행 지식

부록 — 데이터 기초

부록 — 참고

​에이전트 도구란?

​도구 유형

​SQL 도구 (SQL Function Tool)

​데이터 조회 도구

​집계 도구

​Python 도구 (Python Function Tool)

​Retriever 도구 (Vector Search 기반)

​UCFunctionToolkit

​LangChain과 연동

​도구 호출 흐름

​도구 설계 Best Practices

​실전 인사이트: 도구를 10개 이상 등록하면 에이전트가 혼란스러워집니다

​도구 수에 따른 에이전트 성능 변화 (실측)

​도구가 많아질 때 대처법

​실전 인사이트: 도구 설명(Description)이 프롬프트 엔지니어링보다 중요합니다

​나쁜 COMMENT vs 좋은 COMMENT

​실전 인사이트: UC 함수의 실행 권한이 에이전트 보안의 핵심입니다

​에이전트 실행 권한 모델

​실전 보안 체크리스트

​위험한 도구에 대한 Human-in-the-Loop 패턴

​정리

​참고 링크

에이전트 도구란?

도구 유형

SQL 도구 (SQL Function Tool)

데이터 조회 도구

집계 도구

Python 도구 (Python Function Tool)

Retriever 도구 (Vector Search 기반)

UCFunctionToolkit

LangChain과 연동

도구 호출 흐름

도구 설계 Best Practices

실전 인사이트: 도구를 10개 이상 등록하면 에이전트가 혼란스러워집니다

도구 수에 따른 에이전트 성능 변화 (실측)

도구가 많아질 때 대처법

실전 인사이트: 도구 설명(Description)이 프롬프트 엔지니어링보다 중요합니다

나쁜 COMMENT vs 좋은 COMMENT

실전 인사이트: UC 함수의 실행 권한이 에이전트 보안의 핵심입니다

에이전트 실행 권한 모델

실전 보안 체크리스트

위험한 도구에 대한 Human-in-the-Loop 패턴

정리

참고 링크