이 가이드 사용 방법
** 이 교육 자료는 Claude Code (또는 Cursor)와 함께 사용합니다.** 이 모듈에서는 Gold 테이블의 사용자 프로필 데이터를 활용하여 개인화 콘텐츠 추천 모델을 개발하고 배포합니다.
학습 목표
- Feature Engineering: Gold 테이블에서 ML 피처 추출
- ALS 협업 필터링: 사용자-콘텐츠 상호작용 기반 추천 모델
- MLflow Tracking: 실험 관리, 하이퍼파라미터 비교
- Model Registry: Unity Catalog에 모델 등록 및 버전 관리
- Model Serving: 서빙 엔드포인트 배포 및 추론
- Vector Search: 콘텐츠 임베딩 기반 유사도 추천
아키텍처
Step 1: 콘텐츠 메타데이터 테이블 생성
Claude에게 요청하기
Step 2: 사용자-콘텐츠 상호작용 매트릭스 생성
Claude에게 요청하기
Step 3: ALS 추천 모델 학습 (MLflow Tracking)
Claude에게 요청하기
Step 4: 모델을 Unity Catalog에 등록
Claude에게 요청하기
Step 5: 추천 결과 생성 및 검증
Claude에게 요청하기
Step 6: Vector Search 기반 콘텐츠 유사도 추천
Claude에게 요청하기
Step 7: Model Serving 엔드포인트 배포
Claude에게 요청하기
Step 8: 추천 시스템 전체 검증
Claude에게 요청하기
학습 정리
| 개념 | 실습 내용 |
|---|---|
| Feature Engineering | 사용자-콘텐츠 상호작용 매트릭스, 암시적 피드백 |
| ALS 협업 필터링 | PySpark ML, 하이퍼파라미터 튜닝 |
| MLflow Tracking | 실험 관리, 3개 Run 비교, 메트릭/파라미터 로깅 |
| UC Model Registry | 모델 등록, 버전 관리, Alias, 리니지 |
| Vector Search | 콘텐츠 임베딩, Delta Sync Index, 유사도 검색 |
| 하이브리드 추천 | ALS + Vector Search 블렌딩 |
| Model Serving | 엔드포인트 배포, REST API, Scale to zero |