Skip to main content
이 섹션은 Databricks 플랫폼에서 Generative AI를 활용하기 위해 알아야 할 배경지식을 체계적으로 정리합니다.
참고 각 가이드는 독립적으로 읽을 수 있지만, LLM 기초 → Agent 아키텍처 → Prompt Engineering 순서로 읽으면 이해가 더 수월합니다.

이 섹션의 목적

Databricks의 GenAI 기능(Mosaic AI, Agent Framework, AI Playground 등)을 제대로 활용하려면, 그 기반이 되는 기술 개념을 이해해야 합니다. 이 섹션에서는 GenAI 핵심 개념을 실무 관점에서 설명합니다.

대상 독자

  • SE/SA: 고객 데모 및 PoC 수행 시 GenAI 배경지식이 필요한 경우
  • 파트너 엔지니어: Databricks 기반 GenAI 솔루션을 설계하는 경우
  • 고객 기술 리더: AI 전략 수립 시 기술 개념을 파악하고 싶은 경우

선수 지식

  • 기본적인 프로그래밍 경험 (Python 권장)
  • Databricks Workspace 접근 및 Notebook 사용 경험
  • 머신러닝 기초 개념 (선택사항, 없어도 무방)

주요 개념 가이드

가이드설명난이도
NLP에서 LLM까지: 발전사규칙 기반 → 통계 → Word2Vec → RNN/LSTM → Seq2Seq → Attention → Transformer입문~중급
LLM 기초Transformer, 토큰, 컨텍스트 윈도우, Hallucination, 주요 모델 비교입문
AI Agent 아키텍처ReAct, Tool Use (JSON 수준), 멀티에이전트 패턴, 프레임워크 비교중급
Prompt EngineeringZero-shot/Few-shot/CoT 비교, System Prompt 5패턴, Prompt Injection 방어입문~중급
GenAI 평가 방법론Faithfulness/Relevance 구체 예시, LLM-as-Judge vs Human, MLflow Evaluate중급
A2A (Agent-to-Agent)A2A 등장 배경, Agent Card JSON, Task 라이프사이클, MCP 결합 아키텍처중급~고급
Agent 프레임워크 생태계LangChain/LangGraph/CrewAI/OpenAI SDK/AutoGen/Databricks AF 비교, 코드 예시, 선택 가이드중급~고급
Agent UI & 배포 기술 스택Streamlit/Gradio/Chainlit/Dash/FastAPI 비교, Databricks Apps 배포, 단계별 기술 선택중급
AI Proficiency 성숙도4단계 성숙도 모델, 레벨 전환 요건, 자가 진단 체크리스트전략

학습 로드맵: 어디서부터 시작해야 하나?

역할과 목적에 따라 다른 순서로 학습할 수 있습니다.

역할별 권장 경로

역할권장 순서소요 시간
GenAI 입문자NLP 발전사 → LLM 기초 → Prompt Engineering → 평가 방법론4~5시간
Agent 개발자LLM 기초 → Agent 아키텍처 → Agent 프레임워크 → Agent UI → A2A → 평가 방법론6~7시간
기술 리더/전략가AI Proficiency → NLP 발전사 → LLM 기초 → Agent 아키텍처3~4시간
SE/SA (고객 대응)전체 과정 (NLP 발전사 → LLM → Prompt → Agent → 평가 → A2A → AI Proficiency)8~10시간

목적별 권장 경로

목적필수 가이드선택 가이드
”고객에게 GenAI를 설명해야 한다”NLP 발전사, LLM 기초, AI ProficiencyPrompt Engineering
”RAG 챗봇을 만들어야 한다”LLM 기초, Prompt Engineering, 평가 방법론Agent 아키텍처
”Agent를 설계해야 한다”LLM 기초, Agent 아키텍처, Agent 프레임워크, A2AAgent UI, 평가 방법론
”AI 전략을 수립해야 한다”AI Proficiency, LLM 기초Agent 아키텍처

GenAI 기술 발전 타임라인

참고 Transformer 이전의 NLP 발전사(규칙 기반 → 통계 → Word2Vec → RNN/LSTM → Seq2Seq → Attention)는 NLP에서 LLM까지: 발전사에서 상세히 다룹니다.
시기주요 이벤트핵심 키워드영향
1997Hochreiter & Schmidhuber LSTM 발표LSTM, 게이트 메커니즘RNN의 장기 기억 문제 해결, 번역/음성인식의 핵심
2013Google Word2Vec 발표단어 임베딩”king - man + woman = queen” — 단어의 의미를 벡터로 표현
2015Bahdanau Attention 메커니즘 발표AttentionSeq2Seq의 정보 병목 해결, Transformer의 직접적 조상
2017.06Google “Attention Is All You Need” 논문Transformer현대 LLM의 기반 아키텍처 탄생
2018.10Google BERT 공개Pre-training사전학습 → 파인튜닝 패러다임 시작
2020.06OpenAI GPT-3 공개 (175B)Few-shot Learning프롬프트만으로 다양한 작업 수행 가능
2022.11ChatGPT 출시Conversational AIGenAI 대중화, 2개월 만에 1억 사용자
2023.03GPT-4 출시Multimodal LLM이미지 이해, 추론 능력 대폭 향상
2023.06RAG 패턴 확산, Vector DB 부상Retrieval-Augmented Generation환각 감소, 사내 데이터 활용
2023.10AI Agent 개념 부상Agent, Tool UseLangChain, AutoGen 성장, 도구 사용 LLM
2024.03Claude 3 Opus, DBRX 출시Open-weight LLM오픈소스/오픈웨이트 모델 성능 향상
2024.04Databricks Agent Framework GAEnterprise Agent기업용 Agent 구축/배포 통합 환경
2024.11Anthropic MCP 발표Model Context ProtocolLLM-도구 연결 표준화
2025.01DeepSeek R1 공개추론 모델저비용 고성능 추론 모델의 가능성 입증
2025.04Google A2A 프로토콜 발표Agent-to-Agent이기종 에이전트 간 통신 표준
2025.H1Claude 4, GPT-4.1 출시Agentic AI코딩/에이전트 특화 모델, Multi-Agent 시스템 본격 도입
2025.H2Multi-Agent 시스템 본격 확산 (예상)OrchestrationA2A + MCP 결합, 기업용 에이전트 네트워크

Databricks GenAI 기능과의 매핑

GenAI 개념Databricks 기능설명
LLM 사용AI Playground, Foundation Model APIs다양한 모델을 UI/API로 호출
Fine-tuningMosaic AI Training도메인 특화 모델 학습
RAGVector Search, Agent Framework문서 검색 → LLM 답변 생성
AgentMosaic AI Agent FrameworkAgent 구축, 도구 등록, 배포
평가MLflow Evaluate, Review App자동 평가 + 인간 피드백 수집
프롬프트 관리MLflow Prompt Registry프롬프트 버전 관리, 팀 협업
배포Model Serving, Databricks Apps서버리스 배포, 웹 앱 배포
모니터링Lakehouse Monitoring, Inference Tables프로덕션 성능 추적, 이상 감지
거버넌스Unity Catalog, AI Guardrails접근 제어, 입출력 필터링, 감사 로그

GenAI 핵심 용어 사전

용어설명
LLMLarge Language Model — 대규모 언어 모델. 수십억~수조 개의 파라미터로 학습된 딥러닝 모델
Transformer현대 LLM의 기반 아키텍처. Self-Attention 메커니즘으로 문맥을 효과적으로 파악
TokenLLM이 텍스트를 처리하는 최소 단위. 영어 1토큰 ≈ 0.75단어, 한국어는 더 많은 토큰 사용
Context Window모델이 한 번에 처리할 수 있는 최대 토큰 수. 입력+출력 합산
Temperature출력의 무작위성을 조절하는 파라미터. 0=결정적, 1=창의적
RAGRetrieval-Augmented Generation — 외부 문서를 검색하여 LLM에 컨텍스트로 제공하는 패턴
AgentLLM + 도구 사용 + 추론 루프를 결합한 자율 시스템
ReActReasoning + Acting — LLM이 추론과 행동을 번갈아 수행하는 패턴
Tool Use / Function CallingLLM이 외부 함수를 호출할 수 있는 기능
MCPModel Context Protocol — LLM과 외부 도구/데이터를 연결하는 표준 (Anthropic, 2024)
A2AAgent-to-Agent Protocol — 에이전트 간 통신 표준 (Google, 2025)
Fine-tuning사전 학습된 모델을 특정 도메인 데이터로 추가 학습
Hallucination모델이 사실이 아닌 내용을 자신있게 생성하는 현상
Embedding텍스트를 고차원 벡터 공간에 매핑한 수치 표현. 의미적 유사도 계산에 사용
Vector Search임베딩 벡터의 유사도를 기반으로 관련 문서를 검색하는 기술
Prompt Injection악의적 입력으로 LLM의 원래 지시를 무시하게 만드는 공격
GuardrailsLLM 입출력을 필터링하여 안전성을 확보하는 장치
LLM-as-JudgeLLM 출력의 품질을 다른 LLM이 평가하는 패턴
Inference Table모델 서빙 시 요청/응답을 자동으로 기록하는 Databricks 기능
MoEMixture of Experts — 전체 파라미터 중 일부만 활성화하는 효율적 아키텍처
CoTChain-of-Thought — 단계적 추론을 유도하여 정확도를 높이는 프롬프트 기법
Multi-Agent여러 전문 Agent가 협업하여 복잡한 작업을 수행하는 시스템

참고 자료


다음 단계

  1. GenAI가 처음이라면 → NLP 발전사부터 시작 → LLM 기초
  2. Agent 개발에 관심이 있다면 → AI Agent 아키텍처
  3. 조직 전략을 수립 중이라면 → AI Proficiency 성숙도
  4. 실습을 원한다면 → RAG 가이드 또는 Agent Bricks