팀이 단 하나의 AI 에이전트를 배포하기 위해 프롬프트 작성, 모델 튜닝, 데이터 파이프라인 구축에 수 시간을 소비한다면 생산성은 완전히 멈춰 서게 됩니다.
Databricks는 기업 데이터에 대한 전체 빌드 및 최적화 워크플로우를 자동화하여 이러한 병목 현상을 해결하기 위해 Agent Bricks를 도입했습니다.
이 가이드는 제공 기능, 일 방식, 그리고 여러분의 스택에 적합한지 여부를 단계별로 안내합니다.
키 요약
- Databricks Agent Bricks는 합성 데이터와 벤치마크를 활용해 에이전트 생성을 자동화합니다.
- 수동 프롬프트 튜닝을 제거하고 Unity Catalog와 직접 통합됩니다.
- 초기 도입자들은 높은 최적화 비용을 보고하지만 대규모 환경에서 강력한 성능을 발휘한다고 전합니다.
- 베타 기간 중 지역별 접근 한도 및 한도 맞춤형은 여전히 키 위험 요소로 남아 있습니다.
Databricks는 에이전트형 AI를 제공하나요?
네, Databricks는 2025년 6월 11일 샌프란시스코에서 열린 Data+AI 서밋에서 Agent Bricks를 출시했습니다.
이 플랫폼은 도메인 특화 합성 데이터와 작업 인식 벤치마크를 생성하여 AI 에이전트 생성을 자동화한 후, 수동 프롬프트 엔지니어링 없이 비용과 품질 측면에서 모델을 최적화합니다.
2023년 Databricks의 MosaicML 인수를 기반으로 구축된 이 제품은 Databricks를 데이터 레이크하우스 제공자와 에이전트형 AI 플랫폼으로 위치시킵니다.
대량의 내부 문서, 트랜잭션 기록 또는 비정형 콘텐츠가 포함된 데이터를 관리하며, 인사이트 추출, 질의 응답 또는 다단계 워크플로우를 안전하게 조정할 수 있는 에이전트가 필요한 팀을 목표로 합니다.
에이전트 브릭스는 2025년 중반에 공개 베타 서비스에 진입했으며, 초기에는 미국 내 AWS 리전에서 이용 가능하며 연말까지 유럽으로의 확장이 플랜에 포함되어 있습니다.
실제로 어떻게 일할까요?
에이전트 브릭스는 기존의 시행착오 과정을 안내형 파이프라인으로 압축합니다. 사용자는 평이한 언어로 작업을 설명하고, 유니티 카탈로그를 통해 데이터 소스를 연결하기만 하면 시스템이 해당 도메인을 반영하는 합성 훈련 예제를 자동 생성합니다.
이러한 예시들은 정확도, 지연 시간, 비용 측면에서 후보 모델을 평가하는 벤치마크 모음에 반영됩니다. 이후 플랫폼은 추론당 최저 비용으로 품질 막대를 충족하는 구성을 선택합니다.
이 워크플로우를 통해 팀이 일반적으로 데이터 라벨, 프롬프트 조정, A/B 테스트 실행에 소요하는 수주간의 시간이 단축됩니다.
배경에서는 MLflow 3.0이 모든 평가 실행을 기록하므로 모델의 결정을 근본적인 데이터와 매개변수까지 추적할 수 있습니다. 에이전트가 Databricks 레이크하우스 경계 외부로 데이터를 가져오지 않으므로 보안은 유지됩니다.
실제 문제를 해결하는 모습을 볼 때 그 아키텍처 개요가 가장 중요해집니다.
실제 적용 사례는 어떻게 보일까요?
아스트라제네카 데이터 팀은 규제 제출을 위해 구조화된 추출이 필요한 40만 건의 임상 시험 PDF 문서가 쌓여 있는 상황에 직면했습니다. 수동 검토에는 수개월이 소요될 예정이었습니다.
Agent Bricks에서 정보 추출 에이전트를 구성하고 문서 저장소를 지정하여 체험판 프로토콜 스키마를 기반으로 합성 샘플을 생성하도록 했습니다. 해당 에이전트는 코드 없이 60분 이내에 40만 개의 파일을 모두 파싱했습니다.
- 팀은 데이터 추출 병목 현상과 규제 마감일을 파악합니다.
- Unity Catalog를 통해 Agent Bricks를 내부 문서 레이크에 연결합니다.
- 플랫폼은 최적화를 실행하여 작업별 벤치마크를 생성하고 미세 조정된 모델을 선택합니다.
- 에이전트를 프로덕션에 배포하여 수주 걸리던 수동 일을 1시간 미만으로 단축합니다.
하와이안 일렉트릭은 법률 문서 쿼리를 위해 취약한 LangChain 기반 솔루션을 Agent Bricks로 교체했을 때 유사한 성과를 거두었습니다.
새로운 에이전트는 자동화 평가와 인적 평가 모두에서 기존 tool보다 답변 정확도 측면에서 현저히 우수한 성능을 보였으며, 이를 통해 직원들은 규정 준수 조회에 대한 신뢰를 바탕으로 에이전트를 활용할 수 있게 되었습니다.
통합 및 생태계 적합성
Agent Bricks는 Databricks의 통합 계층을 계승하므로, 데이터 및 머신러닝 팀이 이미 사용하는 플랫폼에 직접 연결됩니다.
Unity Catalog는 중앙 거버넌스 hub 역할을 수행하며, 단일 정책 프레임워크 내에서 데이터 레이크, 웨어하우스 및 벡터 스토어에 대한 접근을 관리합니다.
에이전트는 데이터를 외부 서비스로 복사하지 않고도 레이크하우스에 저장된 델타 테이블, 파케트 파일 또는 문서를 쿼리합니다.
| 플랫폼/파트너 | 통합의 본질 |
|---|---|
| Unity Catalog | 데이터, 모델 및 에이전트 출력에 대한 통합 거버넌스 |
| Neon | 트랜잭션 에이전트 워크플로우를 위한 서버리스 Postgres |
| Tecton | 100ms 미만의 지연 시간으로 실시간 기능 제공 |
| OpenAI | 기업 데이터에 대한 GPT-5 네이티브 접근 |
개발자는 표준 Databricks API 및 SDK를 통해 Agent Bricks와 상호작용합니다. ai_query SQL 기능을 통해 분석가는 쿼리 내에서 직접 대규모 언어 모델(LLM)을 호출할 수 있으며, REST 엔드포인트는 모델 서빙 인프라를 통해 에이전트를 제공합니다.
IDE 통합은 CI/CD 파이프라인을 지원하므로 엔지니어는 애플리케이션 코드와 함께 에이전트 구성을 버전 관리할 수 있습니다.
곧 진행될 Tecton 인수를 통해 Agent Bricks에 온라인 기능 저장소가 내장되어 10ms 미만의 지연 시간으로 에이전트에 스트리밍 데이터를 전달할 예정입니다.
이러한 기능은 사기 탐지, 개인화 및 최신 정보에 의존하는 기타 사용 사례를 잠금 해제합니다.
현재 팀들은 배치 기능으로 프로토타입을 제작할 수 있으며, 2026년 중반 통합이 시작되면 실시간 데이터로 전환할 플랜입니다.
커뮤니티 반응 및 초기 사용자 평가
초기 피드백은 사용 편의성에 대한 열광과 베타의 한도에 대한 주의 사이에서 갈리고 있습니다.
한 레딧 사용자는 코드 없이 에이전트를 구축할 수 있는 기능과 Unity Catalog와의 긴밀한 연동을 칭찬하며, 에이전트가 데이터 권한을 자동으로 상속받는 점을 노트했습니다.
동일한 사용자는 완전한 최적화 실행이 일반적으로 1시간 이상 소요되며 컴퓨팅 비용이 100달러 이상 발생한다고 지적했습니다. 이는 실험 과정에서 누적될 수 있습니다.
지역별 가용성 문제로 유럽 팀들은 어려움을 겪었습니다. 2025년 중반 Databricks 계정 담당자가 Agent Bricks가 초기 프리뷰 기간 동안 미국 전용 서비스임을 확인하면서, 일부 고객들은 제품 테스트를 위해 미국 지역에 샌드박스 작업 공간을 생성해야 하는 프롬프트가 있었습니다.
포럼 게시글에서는 프리뷰 버전의 불안정성과 빈번한 기능 변경도 멘션됩니다. 이는 베타 소프트웨어의 일반적인 특징이지만, 사용 사례에 높은 가동 시간이 요구된다면 이에 대비한 플랜 수립이 필요합니다.
종합적으로 볼 때, 베타 버전의 특이점과 컴퓨팅 비용을 감당할 수 있는 초기 도입 기업들은 Agent Bricks가 제공하는 자동화의 가치를 인정합니다. 아스트라제네카의 40만 건 문서 분석과 하와이안 일렉트릭의 정확도 향상 사례는 플랫폼이 생산 규모 작업을 처리할 수 있다는 증거로 업계 전반에 공감을 불러일으키고 있습니다.
엔지니어링 시간을 지금 투자할지, 제품이 성숙해질 때까지 기다릴지 결정할 때 실제 사례를 통한 검증은 중요합니다.
로드맵 및 생태계 Outlook
Databricks는 향후 18개월 동안 Agent Bricks의 지역적 및 기능 확장을 진행할 예정입니다. 2025년 4분기까지 유럽 지역으로 프리뷰가 확대되며, 서유럽의 Azure 배포를 시작으로 진행됩니다.
이러한 단계적 출시를 통해 기업은 일반 제공 선언 전에 다양한 사용자 피드백을 수집하고 지역별 데이터 규정 준수를 보장할 수 있습니다.
2026년 중반에 제공될 Tecton 통합을 통해 에이전트는 스트림, API, 웨어하우스에서 실시간 기능을 추출할 수 있으며, 99.99% 가동률로 초 단위 데이터가 필요한 사기 탐지 및 개인화 사용 사례를 지원합니다.
Neon과 Mooncake는 통합된 "Lakehouse DB" 환경으로 병합되어 에이전트에게 ETL 파이프라인 없이 ACID 준수 쓰기 및 즉각적인 분석 읽기 기능을 제공합니다.
벤처비트의 한 애널리스트는 "에이전트 브릭스는 기업 AI의 중대한 전환점을 알린다"며, 기존 데이터 파이프라인 제거로 인한 10배에서 100배에 이르는 성능 향상을 지적했다.
초기 4가지 유형(정보 추출, 지식 어시스턴트, 다중 에이전트 관리자, 맞춤형 LLM 에이전트)을 넘어선 새로운 에이전트 템플릿을 기대하세요.
Databricks 연구팀은 코드 어시스턴트, 플랜 에이전트, 외부 API 커넥터 개발을 탐구하고 있습니다. OpenAI와의 파트너십을 통해 OpenAI가 GPT-5 및 향후 모델을 출시할 때, Agent Bricks에서 자체 지원 및 거버넌스와 함께 기본적으로 제공될 것입니다.
장기적으로 Databricks는 에이전틱 AI를 플랫폼 내 데이터 엔지니어 및 분석가와 함께 새로운 사용자 역할로 구상합니다. 이 비전에는 규제 산업에서 에이전트 채택이 증가함에 따라 감사 로그, 편향 탐지, 세분화된 정책 제어와 같은 책임 있는 AI 기능에 대한 지속적인 투자가 포함됩니다.
Databricks 에이전틱 AI 비용은 얼마인가요?
Agent Bricks는 선불 라이선스 비용 없이 Databricks의 사용량 기반 요금제를 따르는 팔로워입니다. 컴퓨팅 및 모델 추론 시간(초)당 Databricks Units(DBU)로 청구됩니다.
모델 서빙 및 기능 서빙 업무량은 프리미엄 플랜 기준 DBU-초당 약 0.07달러로 운영되며, 여기에는 기본 클라우드 인스턴스 비용이 포함됩니다. 파운데이션 모델용 GPU 가속 추론 역시 DBU-초당 약 0.07달러 수준입니다.

가장 집약적인 부분은 초기 최적화 실행입니다. 한 초기 사용자는 합성 데이터를 생성하고 에이전트를 튜닝하는 1시간짜리 단일 훈련 주기에 클라우드 컴퓨팅 비용으로 100달러 이상을 지출했다고 보고했습니다.
최적화 후 에이전트 서비스 비용이 크게 절감됩니다. 시스템이 질을 유지하면서도 쿼리당 토큰 수를 줄인 비용 효율적인 모델 구성을 찾아냈기 때문입니다. 팀은 Databricks 예산 정책을 통해 예산 한도를 설정하여 실험 중 지출을 제한할 수 있습니다.
기업 고객은 커밋 패키지 (선불 DBU 시간) 를 구매하여 대량 할인 혜택을 확보할 수 있으며, 이는 온디맨드 과금 대비 초당 요금을 효과적으로 낮춥니다. 정확한 가격은 클라우드 제공자(AWS, Azure, GCP) 및 지역에 따라 달라지며, 일부 지역은 미국 동부 또는 서부보다 약간 높은 요금이 적용될 수 있습니다.
주의해야 할 숨겨진 비용으로는 벡터 검색을 위한 컴퓨팅, 데이터 수집, 그리고 데이터 배포 변화에 따른 기간 재훈련 등이 있습니다. 총 소유권을 계산할 때는 수동 프롬프트 튜닝과 데이터 라벨링을 생략함으로써 절약되는 엔지니어링 시간을 고려하세요.
초기 도입 기업들은 Agent Bricks가 수주간의 수동 일을 제거함으로써 컴퓨팅 비용을 상쇄한다고 보고합니다. 특히 에이전트 배포 지연으로 인한 기회 비용을 고려할 때 더욱 그렇습니다.
