Databricks Agentic AI Is in Beta Now, but Is It Ready?
AI

Databricks Agentic AI hiện đang ở giai đoạn beta, nhưng liệu nó đã sẵn sàng chưa?

Khi nhóm của bạn phải dành hàng giờ để viết các lệnh, tinh chỉnh mô hình và ghép nối các đường ống dữ liệu chỉ để triển khai một tác nhân AI, năng suất sẽ bị đình trệ.

Databricks đã giới thiệu Agent Bricks để giải quyết nút thắt cổ chai bằng cách tự động hóa toàn bộ quy trình xây dựng và tối ưu hóa trên dữ liệu doanh nghiệp.

Hướng dẫn này sẽ hướng dẫn bạn qua những gì nó cung cấp, cách nó làm việc và liệu nó có phù hợp với hệ thống của bạn hay không.

Những điểm khóa cần lưu ý

  • Databricks Agent Bricks tự động hóa việc tạo/lập agent bằng dữ liệu tổng hợp và các tiêu chuẩn đánh giá.
  • Nó loại bỏ việc điều chỉnh prompt thủ công và tích hợp trực tiếp với Unity Catalog.
  • Những người tiên phong sử dụng công nghệ này báo cáo chi phí tối ưu hóa cao nhưng hiệu suất mạnh mẽ khi triển khai trên quy mô lớn.
  • Quyền truy cập theo khu vực và khả năng tùy chỉnh giới hạn vẫn là những rủi ro khóa trong giai đoạn beta.

Databricks có cung cấp AI đại lý không?

Đúng vậy, Databricks đã ra mắt Agent Bricks vào ngày 11 tháng 6 năm 2025 tại Hội nghị Data+AI Summit ở San Francisco.

Nền tảng tự động hóa việc tạo/lập tác nhân AI bằng cách sinh dữ liệu tổng hợp chuyên ngành và các tiêu chuẩn đánh giá công việc, sau đó tối ưu hóa mô hình về chi phí và chất lượng mà không cần thiết kế prompt thủ công.

Dựa trên việc Databricks mua lại MosaicML vào năm 2023, sản phẩm này giúp Databricks xác định vị trí vừa là nhà cung cấp nền tảng dữ liệu lakehouse, vừa là nền tảng AI tự động.

Nó mục tiêu các nhóm quản lý lượng lớn tài liệu nội bộ, hồ sơ giao dịch hoặc nội dung không cấu trúc và cần các agent có thể trích xuất thông tin, trả lời câu hỏi hoặc điều phối các quy trình làm việc đa bước một cách bảo mật.

Agent Bricks đã chính thức ra mắt phiên bản beta công khai vào giữa năm 2025, ban đầu có sẵn trên AWS tại các khu vực của Mỹ theo kế hoạch mở rộng sang châu Âu vào cuối năm.

Nó thực sự là công việc như thế nào?

Agent Bricks loại bỏ vòng lặp dùng thử và lỗi truyền thống bằng cách tạo ra một quy trình hướng dẫn. Bạn mô tả công việc bằng ngôn ngữ thông thường, kết nối các nguồn dữ liệu thông qua Unity Catalog, và hệ thống tự động tạo ra các ví dụ đào tạo tổng hợp phản ánh lĩnh vực của bạn.

Các ví dụ này được đưa vào bộ công cụ đánh giá, nơi các mô hình ứng viên được đánh giá dựa trên độ chính xác, độ trễ và chi phí. Nền tảng sau đó sẽ lựa chọn cấu hình đáp ứng tiêu chuẩn chất lượng của bạn với chi phí thấp nhất cho mỗi lần suy luận.

Quy trình làm việc này loại bỏ thời gian mà các nhóm thường dành để gắn nhãn dữ liệu, điều chỉnh các lời nhắc và chạy các thử nghiệm A/B.

Phía sau hậu trường, MLflow 3.0 ghi lại mọi lần đánh giá, giúp bạn theo dõi quyết định của mô hình trở lại dữ liệu và tham số cơ bản. Bảo mật được duy trì vì các agent không bao giờ lấy dữ liệu ra khỏi biên giới Databricks lakehouse.

Tổng quan kiến trúc này trở nên quan trọng nhất khi bạn thấy nó giải quyết một vấn đề thực tế.

Trong thực tế, điều này trông như thế nào?

Nhóm dữ liệu của AstraZeneca phải đối mặt với một lượng lớn 400.000 tệp PDF dùng thử lâm sàng cần trích xuất có cấu trúc cho các hồ sơ đăng ký. Việc kiểm tra thủ công sẽ mất hàng tháng.

Họ đã cấu hình một agent trích xuất thông tin trong Agent Bricks, chỉ định nó vào kho lưu trữ, và để hệ thống tạo ra các mẫu tổng hợp dựa trên các sơ đồ giao thức dùng thử. Agent này đã phân tích tất cả 400.000 tệp trong vòng dưới 60 phút mà không cần viết mã.

  1. Nhóm xác định điểm nghẽn trong quá trình trích xuất dữ liệu và thời hạn quy định.
  2. Kết nối Agent Bricks với hồ dữ liệu nội bộ thông qua Unity Catalog.
  3. Nền tảng thực hiện tối ưu hóa, tạo ra các tiêu chuẩn đánh giá cụ thể cho từng công việc và lựa chọn mô hình được tinh chỉnh.
  4. Triển khai agent vào môi trường sản xuất, giảm thời gian công việc thủ công từ hàng tuần xuống dưới một giờ.

Hawaiian Electric cũng đạt được kết quả tương tự khi thay thế giải pháp LangChain dễ bị lỗi bằng Agent Bricks cho các truy vấn tài liệu pháp lý.

Công cụ mới này đã vượt trội hơn hẳn công cụ gốc về độ chính xác trong cả đánh giá tự động hóa và đánh giá của con người, giúp nhân viên tự tin sử dụng nó cho các tra cứu tuân thủ.

Tích hợp & Tương thích với hệ sinh thái

Agent Bricks kế thừa lớp tích hợp của Databricks, do đó nó có thể tích hợp trực tiếp vào các nền tảng mà nhóm dữ liệu và machine learning của bạn đã sử dụng.

Unity Catalog đóng vai trò là trung tâm quản trị trung tâm, quản lý quyền truy cập vào các hồ dữ liệu, kho dữ liệu và kho dữ liệu vectơ trong một khung chính sách duy nhất.

Các agent truy vấn các bảng Delta, tệp Parquet hoặc tài liệu được lưu trữ trong lakehouse mà không cần sao chép dữ liệu sang các dịch vụ bên ngoài.

Nền tảng/Đối tácBản chất của tích hợp
Unity CatalogQuản lý thống nhất cho dữ liệu, mô hình và kết quả đầu ra của agent.
NeonPostgres không máy chủ cho các luồng công việc giao dịch của agent
TectonPhục vụ tính năng thời gian thực với độ trễ dưới 100ms
OpenAITruy cập trực tiếp vào GPT-5 trên dữ liệu doanh nghiệp

Các nhà phát triển tương tác với Agent Bricks thông qua các API và SDK tiêu chuẩn của Databricks. Hàm SQL ai_query cho phép các nhà phân tích gọi trực tiếp các mô hình ngôn ngữ lớn (LLMs) trong các truy vấn, và các điểm cuối REST cung cấp các agent thông qua hạ tầng Model Serving.

Tích hợp IDE hỗ trợ các đường ống CI/CD, cho phép các kỹ sư kiểm soát phiên bản cấu hình agent cùng với mã ứng dụng.

Việc mua lại Tecton sắp tới sẽ tích hợp một cửa hàng tính năng trực tuyến vào Agent Bricks, cung cấp dữ liệu thời gian thực cho các agent với độ trễ dưới 10ms.

Khả năng này mở ra các ứng dụng như phát hiện gian lận, cá nhân hóa và các trường hợp sử dụng khác phụ thuộc vào thông tin cập nhật theo thời gian thực.

Hiện tại, các nhóm có thể tạo mẫu với các tính năng xử lý theo lô và kế hoạch chuyển sang sử dụng dữ liệu thời gian thực sau khi tích hợp được triển khai vào giữa năm 2026.

Phản hồi từ cộng đồng và ý kiến của người dùng sớm

Phản hồi ban đầu chia thành hai luồng: sự hào hứng về tính dễ sử dụng và sự thận trọng về các giới hạn của beta.

Một người dùng Reddit đã khen ngợi công cụ xây dựng agent không cần mã và tích hợp chặt chẽ với Unity Catalog, ghi chú rằng các agent tự động kế thừa quyền truy cập dữ liệu.

Người dùng đó cũng cho biết rằng một lần tối ưu hóa đầy đủ thường mất hơn một giờ và tốn hơn $100 chi phí tính toán, điều này có thể tích lũy trong quá trình thử nghiệm.

  • “Nó đơn giản hóa quy trình làm việc của chúng tôi đáng kể và giảm bớt việc điều chỉnh thủ công.” Reddit
  • “Chi phí cho mỗi lần tối ưu hóa có thể cao trong giai đoạn beta.” Reddit
  • Quyền truy cập bảo mật vào nội dung nội bộ giúp xây dựng niềm tin vào nền tảng.

Sự sẵn có theo khu vực đã gây ra khó khăn cho các nhóm tại Châu Âu. Một đại diện tài khoản Databricks đã xác nhận vào giữa năm 2025 rằng Agent Bricks chỉ khả dụng tại Hoa Kỳ trong giai đoạn xem trước ban đầu, khiến một số khách hàng phải tạo các không gian làm việc sandbox tại các khu vực của Hoa Kỳ để thử nghiệm sản phẩm.

Các bài đăng trên diễn đàn cũng đề cập đến sự không ổn định của phiên bản thử nghiệm và các thay đổi tính năng thường xuyên, điều này là bình thường đối với phần mềm beta nhưng đáng có kế hoạch nếu trường hợp sử dụng của bạn yêu cầu thời gian hoạt động cao.

Tổng thể, những người tiên phong có thể chấp nhận các vấn đề của phiên bản beta và chi phí tính toán thấy giá trị trong khả năng tự động hóa mà Agent Bricks mang lại. Việc phân tích 400.000 tài liệu của AstraZeneca và cải thiện độ chính xác của Hawaiian Electric đã tạo tiếng vang trong cộng đồng, chứng minh rằng nền tảng này có thể xử lý các công việc quy mô sản xuất.

Việc xác thực trong thực tế là yếu tố quan trọng khi bạn quyết định liệu nên đầu tư thời gian phát triển ngay bây giờ hay chờ sản phẩm hoàn thiện hơn.

Lộ trình & Triển vọng Hệ sinh thái

Databricks đang mở rộng Agent Bricks về mặt địa lý và hàm trong 18 tháng tới. Đến quý 4 năm 2025, phiên bản thử nghiệm sẽ được triển khai tại các khu vực châu Âu, bắt đầu với các triển khai Azure tại Tây Âu.

Việc triển khai theo giai đoạn cho phép công ty thu thập phản hồi đa dạng từ người dùng và đảm bảo tuân thủ các quy định dữ liệu khu vực trước khi công bố sẵn sàng cho tất cả người dùng.

Tích hợp Tecton vào giữa năm 2026 sẽ cho phép các agent truy xuất các tính năng thời gian thực từ các luồng dữ liệu, API và kho dữ liệu với thời gian hoạt động 99,99%, hỗ trợ các trường hợp sử dụng phát hiện gian lận và cá nhân hóa yêu cầu dữ liệu cập nhật theo thời gian thực.

Neon và Mooncake sẽ hợp nhất thành một trải nghiệm "Lakehouse DB" thống nhất, cho phép các tác nhân thực hiện ghi dữ liệu tuân thủ ACID và đọc phân tích tức thì mà không cần qua các đường ống ETL.

“Agent Bricks đánh dấu một bước ngoặt lớn trong lĩnh vực AI doanh nghiệp,” một nhà phân tích tại VentureBeat ghi chú, chỉ ra sự cải thiện hiệu suất từ 10 đến 100 lần nhờ loại bỏ các đường ống dữ liệu truyền thống.

Đợi chờ các mẫu agent mới ngoài bốn loại ban đầu (Trích xuất thông tin, Trợ lý kiến thức, Giám sát đa agent, Agent LLM tùy chỉnh).

Nghiên cứu của Databricks đang tập trung vào các trợ lý mã nguồn, các tác nhân kế hoạch và các kết nối với các API bên ngoài. Sự hợp tác với OpenAI đảm bảo rằng khi OpenAI phát hành GPT-5 và các mô hình tương lai, chúng sẽ được tích hợp sẵn trong Agent Bricks với sự hỗ trợ chính thức và quản lý từ phía Databricks.

Trong dài hạn, Databricks hình dung AI đại lý như một nhân vật người dùng mới trên nền tảng, song hành cùng các kỹ sư dữ liệu và nhà phân tích. Tầm nhìn này bao gồm việc tiếp tục đầu tư vào các tính năng AI có trách nhiệm như nhật ký kiểm tra, phát hiện thiên vị và kiểm soát chính sách chi tiết khi việc áp dụng AI đại lý ngày càng phổ biến trong các ngành được quy định.

Chi phí của Databricks Agentic AI là bao nhiêu?

Agent Bricks tuân theo mô hình định giá dựa trên sử dụng của Databricks, không yêu cầu phí cấp phép ban đầu. Bạn chỉ trả tiền theo giây cho việc tính toán và suy luận mô hình, được tính bằng Đơn vị Databricks (DBUs).

Các khối lượng công việc Model Serving và Feature Serving có chi phí khoảng $0.07 mỗi DBU-giây trên kế hoạch Premium, bao gồm cả chi phí của đối tượng/kỳ/phiên bản đám mây cơ bản. Việc suy luận được tăng tốc bằng GPU cho các mô hình cơ sở cũng có chi phí gần $0.07 mỗi DBU-giây.

ẢNH CHẬU MÀN HÌNH MINH HOẠCH VỀ BẢNG GIÁ DATABRIC

Phần quan trọng nhất là quá trình tối ưu hóa ban đầu. Một người dùng sớm đã báo cáo chi phí hơn $100 cho dịch vụ điện toán đám mây trong một chu kỳ đào tạo kéo dài một giờ, trong đó tạo ra dữ liệu tổng hợp và điều chỉnh agent.

Sau khi tối ưu hóa, việc triển khai agent trở nên rẻ hơn nhiều vì hệ thống đã xác định được cấu hình mô hình tiết kiệm chi phí, duy trì chất lượng với ít token hơn cho mỗi truy vấn. Các nhóm có thể thiết lập giới hạn ngân sách thông qua chính sách ngân sách của Databricks để kiểm soát chi tiêu trong quá trình thử nghiệm.

Khách hàng doanh nghiệp có thể mua gói cam kết (giờ DBU trả trước) để nhận ưu đãi giảm giá theo khối lượng, giúp giảm chi phí theo giây so với hình thức thanh toán theo yêu cầu. Giá chính xác phụ thuộc vào nhà cung cấp đám mây (AWS, Azure, GCP) và khu vực, với một số khu vực có chi phí cao hơn so với khu vực Đông hoặc Tây Hoa Kỳ.

Các chi phí ẩn cần lưu ý bao gồm chi phí tính toán cho tìm kiếm vector, thu thập dữ liệu và đào tạo lại kỳ khi phân phối dữ liệu của bạn thay đổi. Hãy tính đến thời gian kỹ thuật tiết kiệm được bằng cách bỏ qua việc điều chỉnh prompt thủ công và gắn nhãn dữ liệu khi tính toán tổng chi phí quyền sở hữu.

Những người tiên phong sử dụng cho biết rằng số tuần công việc thủ công mà Agent Bricks loại bỏ thường bù đắp được chi phí tính toán, đặc biệt khi xem xét chi phí cơ hội do việc triển khai agent bị trì hoãn.

ClickUp Logo

Một ứng dụng thay thế tất cả