GenAI 핵심 개념 총정리 - Databricks 가이드

이 섹션은 Databricks 플랫폼에서 Generative AI를 활용하기 위해 알아야 할 배경지식을 체계적으로 정리합니다.

각 가이드는 독립적으로 읽을 수 있지만, LLM 기초 → Prompt Engineering → Agent 아키텍처 순서로 읽으면 이해가 더 수월합니다.

대상 독자

SE/SA: 고객 데모 및 PoC 수행 시 GenAI 배경지식이 필요한 경우
파트너 엔지니어: Databricks 기반 GenAI 솔루션을 설계하는 경우
고객 기술 리더: AI 전략 수립 시 기술 개념을 파악하고 싶은 경우

주요 개념 가이드

가이드	설명	난이도
NLP에서 LLM까지	규칙 기반 → Word2Vec → Attention → Transformer	입문
LLM 기초	Transformer, 토큰, 컨텍스트 윈도우, Hallucination	입문
Prompt Engineering	Zero-shot/Few-shot/CoT, System Prompt, Injection 방어	입문~중급
AI Agent 아키텍처	ReAct, Tool Use, 메모리, 멀티에이전트	중급
Agent 프레임워크	LangChain/LangGraph/CrewAI/Databricks AF 비교	중급~고급
A2A 프로토콜	Agent-to-Agent 통신 표준, MCP 결합	중급~고급
Agent 생태계	OpenAI/Anthropic/Google/AWS 전략 비교	중급
Agent UI	Streamlit/Gradio/Chainlit/Databricks Apps	중급
평가	Faithfulness/Relevance, LLM-as-Judge, MLflow	중급
AI 성숙도	4단계 성숙도 모델, 자가 진단 체크리스트	전략

역할별 추천 경로

역할	추천 순서	소요 시간
GenAI 입문자	NLP 발전사 → LLM 기초 → Prompt Engineering	3~4시간
Agent 개발자	LLM 기초 → Agent 아키텍처 → Agent 프레임워크 → 평가	5~6시간
기술 리더	AI 성숙도 → LLM 기초 → Agent 아키텍처	2~3시간

핵심 용어 10선

용어	설명
LLM	수십억 파라미터로 학습된 대규모 언어 모델
Transformer	Self-Attention 기반의 현대 LLM 아키텍처
RAG	외부 문서를 검색하여 LLM에 컨텍스트로 제공하는 패턴
Agent	LLM + 도구 사용 + 추론 루프를 결합한 자율 시스템
MCP	LLM과 외부 도구/데이터를 연결하는 표준 프로토콜
Fine-tuning	사전 학습 모델을 도메인 데이터로 추가 학습
Hallucination	모델이 사실이 아닌 내용을 자신있게 생성하는 현상
Embedding	텍스트를 벡터 공간에 매핑한 수치 표현
CoT	Chain-of-Thought — 단계적 추론 유도 프롬프트 기법
Guardrails	LLM 입출력 필터링으로 안전성을 확보하는 장치

전체 용어는 Databricks 소개 → 용어 사전 에서 확인하세요.

다음 단계

GenAI가 처음이라면 → NLP 발전사 → LLM 기초
Agent 개발에 관심이 있다면 → AI Agent 아키텍처
조직 전략을 수립 중이라면 → AI 성숙도
실습을 원한다면 → RAG 가이드 또는 Agent Bricks

NLP에서 LLM까지: 언어 모델의 발전사