Skip to main content
원문: Why agentic analytics starts with a well-governed data layer (2026-04-02)
작성자: Catherine Brown (인터뷰어), Nick Eayrs (인터뷰이)
AI가 임원들의 데이터 상호작용 방식을 바꾸면서, 애널리틱스는 대시보드 시대를 벗어나 훨씬 더 역동적인 운영 모델로 전환되고 있습니다. 자연어 인터페이스, AI 기반 인사이트, 에이전틱 워크플로우는 더 폭넓은 인텔리전스에 대한 접근을 약속하지만, 동시에 많은 조직이 수년간 안고 살아온 문제를 수면 위로 드러냅니다. 바로 파편화된 정의, 일관성 없는 지표, 그리고 AI 규모를 위해 설계된 적 없는 거버넌스 모델입니다. 이것이 실제로 무엇을 의미하는지 알아보기 위해, Databricks의 아시아태평양 및 일본(APJ) 지역 필드 엔지니어링 담당 부사장인 Nick Eayrs와 이야기를 나눴습니다. 여러 지역에 걸쳐 약 25년간 리더십을 발휘해 온 Eayrs는 데이터 인사이트가 조직 내에서 어떻게 가속기 역할을 할 수 있는지, 그리고 에이전틱 애널리틱스의 새 시대에서 성공하기 위해 무엇이 필요한지에 대한 폭넓은 시각을 갖고 있습니다. 이러한 배경은 데이터 및 AI 전략이 시장, 운영 모델, 기업 성숙도 수준에 따라 어떻게 전개되는지에 대한 넓은 관점을 그에게 제공합니다. 대화의 핵심 주제는 AI가 시맨틱스와 거버넌스의 필요성을 없애는 것이 아니라 오히려 훨씬 더 중요하게 만든다는 그의 확신이었습니다. 그의 관점에서, 조직은 데이터 레이어 아래에 있는 비즈니스 정의, 계보, 접근 제어, 오픈 표준을 바로잡기 전까지는 신뢰할 수 있는 AI 결과를 얻을 수 없습니다. 이러한 것들이 비용과 복잡성에 압도되지 않으면서 인텔리전스를 확장할 수 있게 해주는 요소입니다.

AI가 애널리틱스의 규칙을 다시 쓰고 있다

Catherine Brown: AI가 기존 BI에서는 다룰 필요가 없었던 방식으로 시맨틱스와 거버넌스에 압력을 가하는 이유는 무엇인가요? Nick Eayrs: 레거시 BI는 정적인 대시보드와 미리 정의된 보고서의 세계였습니다. 비즈니스 사용자는 상당히 복잡한 인터페이스를 탐색해야 했고, 후속 질문이 있거나 무언가를 더 깊이 탐구하고 싶다면 보통 전문가의 지원이 필요했습니다. 진정한 셀프서비스는 거의 없었습니다. 기존 BI 아래의 시맨틱 레이어도 비교적 정적이었고 변경 속도가 느렸습니다. 비즈니스에서 매출, 이탈률 또는 고객 생애 가치에 대한 새로운 정의가 필요하면, 보통 IT나 전문가 팀에 돌아가서 시맨틱 레이어를 업데이트하고 보고서를 다시 만들어야 했습니다. 매우 미리 정해진 모델이었죠. AI는 이를 완전히 바꿉니다. 더 이상 정적일 필요가 없고, 순수하게 기술적(descriptive)일 필요도 없습니다. 기존 BI는 흔히 백미러 애널리틱스입니다. 무슨 일이 일어났는지를 알려줍니다. AI를 사용하면 무엇이 일어날지 예측하고, 왜 일어났는지 물으며, 다음에 무엇을 해야 하는지 이해할 수 있습니다. 훨씬 더 많은 데이터에 대해 스스로 추론하고 실시간으로 인사이트를 생성할 수 있습니다. 하지만 그 세계에서 시맨틱스가 사라지는 것은 아닙니다. 오히려 더 중요해집니다. AI와 에이전트는 여전히 그 아래의 데이터에 의해 작동합니다. 이는 쓰레기를 넣으면 쓰레기가 나온다는 옛 원칙으로 되돌아갑니다. 제품, 서비스, 분류 체계, 용어에 대한 올바른 비즈니스 컨텍스트를 갖춘 신뢰할 수 있는 고품질 데이터를 많이 확보할수록 AI 경험의 질이 높아집니다. 누군가가 “Q3 목표를 왜 달성하지 못했나요?”라고 물으면, 시스템은 해당 조직에서 “목표”가 무엇을 의미하는지, 사용자가 어떤 기간을 언급하는지, 그 지표가 어떻게 정의되는지를 이해해야 합니다. 그 시맨틱 컨텍스트가 없으면 시스템은 추측할 뿐입니다. 일반적인 답변을 낼 수는 있지만, 신뢰할 수 있는 답변은 아닙니다. 여기에 또 하나 중요한 점이 있습니다. Databricks의 관점에서 시맨틱 레이어는 개방적이고 상호운용 가능해야 합니다. 전통적인 BI 벤더들은 시맨틱 모델을 자체 도구 안에 가두는 경우가 많아서, 모든 것이 해당 인터페이스를 통해 흘러야 합니다. 이는 큰 제약이 됩니다. AI와 에이전틱 경험을 확장하려면, 적절한 데이터 기반과 가드레일이 갖춰져 있을 때 좋은 성과를 낼 수 있습니다. APJ의 강력한 맞춤형 사례로 Takeda가 있습니다. 적절한 데이터 기반과 가드레일을 갖춤으로써 상업, R&D, 제조, 백오피스 기능 전반에 걸쳐 여러 AI 사용 사례를 구축할 수 있었습니다. Catherine: AI가 애널리틱스에 가하는 거버넌스 압력에 대해 좀 더 구체적으로 말씀해 주실 수 있나요? Nick: BI 쪽이든 AI 쪽이든, 거버넌스는 결국 신뢰, 계보, 추적 가능성의 문제입니다. 대시보드나 비즈니스 인텔리전스 인사이트를 생산할 때, 그것이 어떻게 만들어졌는지 이해할 수 있어야 합니다. 어떤 기반 데이터가 사용되었나요? 지표는 어떻게 정의되었나요? 이를 모른다면 보고 있는 내용을 신뢰할 수 없습니다. AI 쪽에서도 마찬가지입니다. 모델, 에이전트 또는 에이전틱 애플리케이션의 출력이 어떻게 도출되었는지 이해할 수 없다면 그 결과를 신뢰하지 않을 것입니다. 어떤 테이블에서 왔나요? 어떤 피처가 사용되었나요? 어떤 모델이 추론을 서빙했나요? 이 엔드투엔드 계보가 필수적입니다. 규정 준수 차원도 있습니다. 고도로 규제되는 산업에서 조직들은 점점 더 그 추적 가능성을 증명해야 할 것입니다. AI 기반 의사결정이 소비자, 시민 또는 환자에게 외부적으로 노출되고 있다면, 그것이 어떻게 만들어졌는지를 뒷받침하고 감사할 수 있어야 합니다. AI가 애널리틱스에 더 많은 압력을 가하는 이유는 신뢰와 추적 가능성에 대한 기대가 높아지고 있기 때문입니다.

파편화된 지표가 의사결정을 늦추고 있다

Catherine: 가장 흔하게 보시는 상충하는 지표 패턴은 무엇이며, 그것이 조직에 어떤 비용을 초래하나요? Nick: 가장 큰 문제는 파편화입니다. 대부분의 조직에는 여러 BI 도구가 있고, 각 도구마다 자체 시맨틱 모델과 비즈니스 지표에 대한 자체 해석이 있을 수 있습니다. 그러면 신뢰할 수 있는 단일 기준점이 없고 일치하지 않을 수 있는 중복된 로직이 많아집니다. 어떤 대시보드는 매출을 한 가지 방식으로 정의할 수 있습니다. 다른 도구는 다르게 정의할 수 있습니다. 재무 부서의 누군가는 Excel의 또 다른 버전으로 작업할 수 있습니다. 그 시점에서 신뢰는 매우 빠르게 무너지기 시작합니다. 의사결정이 느려지는 이유는 사람들이 더 이상 의사결정 자체를 논의하는 것이 아니라 어떤 숫자가 맞는지를 논의하고 있기 때문입니다.

레거시 BI 모델이 AI 규모에서 무너지는 이유

Catherine: 도구 안에 갇힌 대시보드 로직이 AI 규모에서 무너지는 이유는 무엇인가요? Nick: 기존 BI 도구들은 종종 소스 시스템에서 데이터를 추출하고, 특정 보고 결과를 위해 집계한 뒤, 독점 스토리지로 이동시키고, 그 위에 독점적인 시맨틱스와 대시보드를 레이어로 쌓습니다. 모든 것이 도구 안에 갇히게 됩니다. 이것이 AI 세계에서 진짜 문제가 되는 이유는 사용자가 항상 후속 질문을 하기 때문입니다. 더 깊이 파고들고 싶어합니다. 그 로직을 다른 시스템에 노출하고 싶어합니다. 데이터 사이언티스트나 머신러닝 팀이 그 위에 구축하기를 원합니다. 모든 것이 하나의 독점 레이어에 갇혀 있으면 이것이 잘 작동하지 않습니다. 계속해서 소스로 돌아가 더 많은 데이터를 가져오고, 다시 변환하고, 로직을 다시 구축해야 합니다. 반복적이고 비용이 많이 듭니다. 대신 모든 것이 오픈 데이터 포맷과 오픈 인터페이스 위에 구축된다면, BI, AI, 노트북, 에이전트, 데이터 사이언스 팀 모두 동일한 거버넌스된 기반 위에서 작업할 수 있습니다. 데이터를 한 번 저장하고 처리합니다. 모두가 자연어로 상호작용할 수 있습니다. 모두가 그 위에 구축할 수 있습니다. 이것이 확장에 훨씬 더 나은 모델입니다. 기존 방식에는 상당한 엔지니어링 부담도 있습니다. 파편화된 시스템을 정렬 상태로 유지하기 위해 많은 동기화 파이프라인과 많은 커스텀 코드를 유지해야 합니다. 그 복잡성은 정당화하기가 매우 어렵습니다.

기계가 읽을 수 있는 시맨틱 레이어의 모습

Catherine: 기계가 읽을 수 있는 시맨틱 레이어는 실제로 어떤 모습인가요? Nick: 첫째, 비즈니스 지표는 기반 기둥으로 취급되어야 합니다. 이는 매출, 이탈률, 고객 생애 가치 같은 것들의 정의가 조직 전체에 걸쳐 명시적으로 정의되고, 인증되며, 재사용 가능해야 한다는 것을 의미합니다. 둘째, 그 지표들은 표준 언어, 주로 SQL을 통해 접근 가능해야 하며, BI 도구뿐만 아니라 AI 인터페이스, 노트북, 에이전트에서도 사용할 수 있어야 합니다. 접근 가능하고 재사용 가능하지 않다면 문제를 실제로 해결한 것이 아닙니다. 셋째, 개방성과 상호운용성이 필요합니다. 모든 비즈니스 로직을 꺼낼 수 없는 시스템 안에 밀어 넣고 싶지는 않을 것입니다. 오픈 표준은 선택의 자유와 시스템이나 제공자를 교체해야 할 때의 안전한 출구 전략을 제공하기 때문에 중요합니다. AI 지원 거버넌스도 필요합니다. 에이전틱 세계에서는 수천 개의 모델이나 에이전트가 항상 시맨틱 레이어와 상호작용할 수 있습니다. 메타데이터, 주석, 비즈니스 지표를 최신 상태로 유지하는 것은 이 모든 것이 수동으로 처리된다면 엄청난 도전이 됩니다. AI는 그 메타데이터를 생성하고 유지하는 데 도움을 줄 수 있어서, 시맨틱 레이어가 규모에 맞게 사용 가능한 상태를 유지할 수 있습니다. 그리고 물론 대화형 및 상황 인식 인텔리전스가 위에 있어서 에이전트와 애플리케이션이 API와 자연어 인터페이스를 통해 해당 레이어와 상호작용할 수 있어야 합니다. Catherine: 평가(evaluation)는 여기서 어디에 해당하나요? 데이터의 인증이 먼저 이루어지고, 그 다음에 AI 레이어와 평가가 오나요? Nick: 네. 데이터 기반이 먼저입니다. AI가 그 데이터를 잘 활용하기 전에 메타데이터, 비즈니스 로직, 주석, 비즈니스 지표가 갖춰져 있어야 합니다. 그 다음에 AI 또는 에이전틱 레이어를 그 위에 구축합니다. 그 후에 평가 프레임워크가 등장하여 출력이 기대에 부합하는지 검증하고 시스템이 하고 있는 것을 정제합니다. 하지만 평가 레이어는 기반을 올바르게 갖추는 것의 대체물이 아닙니다. 그 기반에 의존합니다.

시트당 과금 BI 모델이 도입과 가치 창출을 제한하는 이유

Catherine: 시트당 과금 BI 모델이 도입과 가치 창출을 적극적으로 제한하는 부분은 어디인가요? Nick: 데이터와 AI 민주화의 목표는 조직의 모든 지식 노동자에게 인텔리전스를 전달하는 것이어야 합니다. 시트당 과금 모델은 이 목표에 직접적으로 반합니다. 민주화를 제약합니다. 어떤 사용자, 팀 또는 비즈니스 유닛이 접근 권한을 가질지 조직이 선택하도록 강제하기 때문입니다. 혁신도 제약합니다. 이제 비즈니스 가치가 아닌 라이선스 가용성에 따라 어떤 프로젝트가 진행될 수 있는지를 결정하게 되기 때문입니다. 가치 창출에도 영향을 미칩니다. 최고의 결과는 다양한 팀이 비즈니스 문제를 중심으로 함께 모일 때 나옵니다. 그 팀 중 일부만 시스템에 접근할 수 있다면 협업을 제한하고 조직의 가치 창출 능력을 제한합니다. 효율성 문제도 있습니다. 소비 기반 모델에서는 사용한 만큼 지불합니다. 사용량이 늘면 늘어난 사용량에 대해 지불합니다. 제로로 떨어지면 제로를 지불합니다. 이는 과소 사용되거나 과잉 프로비저닝될 수 있는 시트 라이선스에 대해 지불하는 것보다 훨씬 합리적인 모델입니다. Catherine: 일부 조직에서는 라이선스 제한이 사실상 거버넌스 레이어 역할을 한다고 주장할 수 있습니다. 이에 대해 뭐라고 하시겠어요? Nick: 라이선스를 제한하여 데이터 접근을 거버넌스하려 한다면, 실패할 것입니다. 그것은 잘못된 제어 지점입니다. 좋은 거버넌스는 플랫폼과 데이터 레이어에서 시작됩니다. 역할 기반 및 속성 기반 제어, ID 시스템과 연결된 인증 및 권한 부여, 데이터 자산의 명확한 분리 및 분류에서 시작됩니다. 자격 부여와 정책 집행을 먼저 해결합니다. 이를 올바르게 수행하면 사람들이 자신이 볼 수 있어야 하는 것만 보도록 보장하면서도 접근을 폭넓게 배포할 수 있습니다. 시트 라이선스를 거버넌스 메커니즘으로 사용하는 것은 확장 가능하지 않으며, 기반 거버넌스 작업을 수행하는 것의 대체물이 아닙니다.

신뢰를 높이고 비용을 낮추는 가장 빠른 방법

Catherine: 신뢰를 높이고 동시에 애널리틱스 비용을 줄이기 위해 조직이 할 수 있는 가장 빠른 아키텍처 조치는 무엇인가요? Nick: 가장 중요한 조치는 강력한 거버넌스 기반 위에 구축된 통합 시맨틱 레이어를 수립하는 것입니다. 이것은 카탈로그 결정에서 시작됩니다. 데이터와 AI 자산을 어떻게 거버넌스할 것인가? 카탈로그가 갖춰지면 거기서 시맨틱스를 정의하고, 비즈니스 지표를 인증하며, 신뢰할 수 있는 단일 기준점을 만들 수 있습니다. Databricks 모델에서 이 진실 공급원은 개방적이고 상호운용 가능하며, 이것이 매우 중요합니다. 이를 수행하면 몇 가지 일이 일어납니다. 계보, 거버넌스, 감사 가능성, 인증된 정의가 있기 때문에 신뢰가 생깁니다. 불필요한 중복과 반복적인 ETL을 피하기 때문에 단순화가 이루어집니다. 그리고 누군가 새로운 질문을 할 때마다 로직을 다시 구축할 필요가 없기 때문에 IT 부담이 줄어듭니다. 구현 패턴은 비교적 명확합니다. 첫째, 데이터 기반을 올바르게 구축하세요. 둘째, 시맨틱 레이어를 구축하고 비즈니스 지표를 인증하세요. 셋째, AI를 레이어로 추가한 다음 평가 프레임워크를 사용하여 그 출력을 모니터링하고 정제하세요. 이 순서가 중요합니다. NTT Docomo가 좋은 사례입니다. Databricks Lakehouse, Unity Catalog, 워크플로우를 사용하여 로그 분석을 자동화한 결과, 월 66시간의 수작업 처리 시간을 6시간으로 줄이고 분석 효율성을 90% 향상시켰습니다. 이는 거버넌스와 기반이 훨씬 더 빠른 의사결정을 가능하게 하는 강력한 사례입니다.

APJ가 데이터와 AI 수익화에서 더 빠르게 움직이는 이유

Catherine: APJ 기업들이 AI를 위한 데이터 레이어 수익화에 있어 다르게 또는 더 빠르게 하고 있는 것은 무엇인가요? Nick: APJ는 놀라울 정도로 다양하기 때문에 매력적인 시장입니다. 매우 다른 국가, 언어, 성숙도 수준, 규제 환경을 다루고 있습니다. 하지만 공통 패턴 중 하나는 조직들이 디지털 전환에 매우 빠르게 움직이는 경향이 있으며, 지역 전반의 많은 정부가 명확한 국가 AI 전략을 갖추고 있다는 것입니다. 고객들로부터 보는 것은, 종종 거버넌스와 데이터 기반 레이어를 먼저 구축한 다음, 그 기반이 갖춰지면 AI 네이티브 애플리케이션으로 빠르게 이동한다는 것입니다. 이 순서가 중요합니다. 금융 서비스 같은 산업에서도 이런 패턴을 봅니다. 고객들이 거버넌스된 데이터 레이어 위에 애널리틱스를 통합한 다음 접근을 민주화합니다. 또 다른 예로 일본의 Net One Systems가 있습니다. 기반이 갖춰진 후, 다른 시스템과 통합된 AI 융합 지식 도구를 구축하여 지원 쿼리에 대한 응답 시간을 75% 단축하고 연간 10,000시간의 노동력을 절감했습니다. APJ에서 특히 독특한 점 중 하나는 다국어 차원입니다. 고객들이 일본어, 만다린, 광둥어, 태국어 및 기타 현지 언어로 기능을 구축하고 있습니다. 이는 강력하지만, 기반 데이터 레이어가 이를 지원할 수 있을 만큼 충분히 거버넌스되고 잘 구조화되어 있을 때만 작동합니다. APJ 고객들은 기반을 빠르게 올바르게 구축한 다음, 그 위에 AI 우선 애플리케이션 개발로 신속하게 전환하는 경향이 있습니다. 많은 경우에 다른 지역보다 더 빠르게 움직이고 있습니다.

마무리

Nick의 요점은 기술적이면서도 전략적입니다. AI에서 가치를 만들어내는 조직들은 애널리틱스, 시맨틱스, 거버넌스를 별개의 대화로 취급하지 않습니다. 그것들을 하나의 기반으로 취급합니다. 임원들에게 이것이 중요한 이유는 보상이 더 나은 아키텍처에 그치지 않기 때문입니다. 더 빠른 의사결정, 인사이트에 대한 더 넓은 접근, 그리고 규모에 맞는 더 낮은 애널리틱스 비용입니다. AI는 파편화된 데이터 레이어를 고치지 않습니다. 그것을 드러냅니다. 실험에서 신뢰할 수 있는 인텔리전스로 가장 빠르게 전환하는 기업들이 자신들의 분야를 정의하게 될 것입니다. 그 기업들은 지표를 명확하게 정의하고, 중앙에서 거버넌스하며, 애널리틱스와 AI가 동일한 진실 위에서 구축할 수 있을 만큼 충분히 개방적으로 만드는 기업들입니다. 효과적인 운영 모델 구축에 대해 더 알아보려면, Databricks AI Maturity Model을 다운로드하세요.

참고 자료