Guardrails 설정
에이전트의 안전한 운영을 위해 입출력에 대한 제한을 설정할 수 있습니다.AI Gateway Guardrails
Guardrails 유형
| 유형 | 설명 |
|---|---|
| Safety Filter | 유해하거나 부적절한 콘텐츠를 자동으로 필터링합니다 |
| PII Detection | 개인정보(이름, 전화번호, 주민번호 등)를 감지하고 차단합니다 |
| Topic Control | 허용된 주제만 응답하고, 금지된 주제는 거부합니다 |
| Rate Limiting | 사용자별/전체 요청 수를 제한하여 남용을 방지합니다 |
트러블슈팅 가이드
자주 발생하는 문제
| 문제 | 원인 | 해결 방법 |
|---|---|---|
| 엔드포인트가 시작되지 않음 | 의존성 누락 또는 버전 충돌 | pip_requirements에 모든 패키지와 정확한 버전을 명시합니다 |
ModuleNotFoundError | 패키지가 설치되지 않음 | pip_requirements에 해당 패키지를 추가합니다 |
| 환경 변수 접근 실패 | 환경 변수가 설정되지 않음 | 엔드포인트 설정에서 environment_vars를 확인합니다 |
| Vector Search 권한 오류 | 서비스 프린시펄 권한 부족 | resources에 VS Index를 명시하거나 수동으로 권한을 부여합니다 |
| Scale to Zero 후 지연 | 콜드 스타트 시간 | 프로덕션에서는 scale_to_zero_enabled=False 권장 |
| 응답 시간 초과 | 에이전트 로직이 너무 복잡 | 도구 호출 수 제한, LLM 응답 스트리밍 활성화 |
엔드포인트 상태 확인
배포 전 로컬 테스트
배포 전에 로깅된 모델을 로컬에서 먼저 테스트하는 것을 권장합니다.실습: 에이전트 배포 전체 워크플로
전체 배포 과정을 순서대로 정리하면 다음과 같습니다.정리
| 핵심 포인트 | 설명 |
|---|---|
| 배포 파이프라인 | 개발 → MLflow 로깅 → UC 등록 → Model Serving → 모니터링 |
| agents.deploy() | 엔드포인트, Review App, Inference Tables를 한 번에 설정하는 가장 간편한 방법입니다 |
| set_model() | 에이전트 코드를 별도 파일로 분리하고, 진입점을 지정하는 권장 패턴입니다 |
| Review App | 배포 전 테스터 피드백을 수집하고, 평가 데이터셋으로 활용합니다 |
| Inference Tables | 모든 요청/응답을 자동 기록하여 모니터링과 디버깅에 활용합니다 |
| Guardrails | Safety, PII, Topic Control, Rate Limiting으로 안전한 운영을 보장합니다 |
| 버전 관리 | UC 앨리어스(champion/challenger)로 무중단 업데이트와 롤백이 가능합니다 |