Databricks Agentic AI Is in Beta Now, but Is It Ready?
AI

Databricks Agentic AI เปิดให้ใช้งานเวอร์ชันเบต้าแล้ว แต่พร้อมใช้งานจริงหรือยัง?

เมื่อทีมของคุณใช้เวลาหลายชั่วโมงในการเขียนคำสั่ง ปรับแต่งโมเดล และประกอบเส้นทางการประมวลผลข้อมูลเพียงเพื่อจะนำเอเจนต์ AI หนึ่งตัวไปใช้งาน ประสิทธิภาพการทำงานก็หยุดชะงักลง

Databricks ได้แนะนำ Agent Bricks เพื่อแก้ไขปัญหาคอขวดนั้นโดยการทำให้กระบวนการสร้างและปรับแต่งทั้งหมดเป็นอัตโนมัติบนข้อมูลขององค์กร

คู่มือนี้จะแนะนำคุณเกี่ยวกับสิ่งที่มันมีให้, วิธีการทำงาน, และว่ามันเหมาะกับระบบของคุณหรือไม่

ประเด็นสำคัญ

  • Databricks Agent Bricks ทำให้การสร้างตัวแทนเป็นอัตโนมัติโดยใช้ข้อมูลสังเคราะห์และเกณฑ์มาตรฐาน
  • มันกำจัดความจำเป็นในการปรับแต่งคำแนะนำด้วยตนเองและผสานรวมโดยตรงกับ Unity Catalog
  • ผู้ใช้งานกลุ่มแรกรายงานว่ามีค่าใช้จ่ายในการปรับแต่งสูง แต่มีประสิทธิภาพที่แข็งแกร่งเมื่อใช้งานในระดับใหญ่
  • การเข้าถึงในระดับภูมิภาคและการปรับแต่งที่จำกัดยังคงเป็นความเสี่ยงสำคัญในช่วงเบต้า

Databricks มีบริการ AI แบบตัวแทนหรือไม่?

ใช่, Databricks ได้เปิดตัวAgent Bricks ในวันที่ 11 มิถุนายน 2025ที่งาน Data+AI Summit ในซานฟรานซิสโก

แพลตฟอร์มนี้สร้างตัวแทน AI โดยอัตโนมัติด้วยการสร้างข้อมูลสังเคราะห์เฉพาะโดเมนและเกณฑ์มาตรฐานที่ตระหนักถึงงาน จากนั้นจึงปรับแต่งโมเดลให้เหมาะสมทั้งในด้านต้นทุนและคุณภาพโดยไม่ต้องใช้การเขียนคำแนะนำด้วยตนเอง

สร้างขึ้นจากการที่ Databricks เข้าซื้อกิจการ MosaicML ในปี 2023 ผลิตภัณฑ์นี้ทำให้ Databricks กลายเป็นทั้งผู้ให้บริการ data lakehouse และแพลตฟอร์ม AI แบบ agentic

มันมุ่งเป้าไปที่ทีมที่จัดการเอกสารภายในจำนวนมาก บันทึกธุรกรรม หรือเนื้อหาที่ไม่มีโครงสร้าง และต้องการตัวแทนที่สามารถดึงข้อมูลเชิงลึก ตอบคำถาม หรือประสานงานขั้นตอนการทำงานหลายขั้นตอนได้อย่างปลอดภัย

เอเจนต์บิกส์ เข้าสู่ช่วงเบต้าสาธารณะในกลางปี 2025 โดยเริ่มให้บริการบน AWS ในภูมิภาคของสหรัฐอเมริกา และมีแผนจะขยายไปยังยุโรปในปลายปี

มันทำงานอย่างไรจริงๆ?

เอเจนต์ Bricks รวมวงจรการลองผิดลองถูกแบบดั้งเดิมให้กลายเป็นกระบวนการที่มีแนวทางชัดเจน คุณเพียงแค่อธิบายงานที่ต้องการในภาษาที่เข้าใจง่าย เชื่อมต่อแหล่งข้อมูลของคุณผ่าน Unity Catalog และระบบจะสร้างตัวอย่างการฝึกอบรมแบบสังเคราะห์ที่สะท้อนโดเมนของคุณโดยอัตโนมัติ

ตัวอย่างเหล่านี้ถูกนำไปใช้ในชุดมาตรฐานการวัดประสิทธิภาพ (benchmark suite) ซึ่งให้คะแนนแบบจำลองที่เป็นผู้สมัครตามความถูกต้อง (accuracy), ความหน่วงเวลา (latency), และต้นทุน (cost) แพลตฟอร์มจะคัดเลือกการตั้งค่าที่ให้คุณภาพตามเกณฑ์ของคุณในราคาต่อหนึ่งการคำนวณ (inference) ที่ต่ำที่สุด

กระบวนการทำงานนี้ช่วยลดเวลาหลายสัปดาห์ที่ทีมมักใช้ในการติดป้ายข้อมูล ปรับแต่งข้อความกระตุ้น และทดสอบแบบ A/B

เบื้องหลังการทำงาน MLflow 3.0 บันทึกทุกการประเมินผล เพื่อให้คุณสามารถติดตามการตัดสินใจของโมเดลย้อนกลับไปยังข้อมูลและพารามิเตอร์พื้นฐานได้ ความปลอดภัยยังคงสมบูรณ์เนื่องจากเอเจนต์จะไม่ดึงข้อมูลออกนอกขอบเขตของ Databricks lakehouse แต่อย่างใด

ภาพรวมทางสถาปัตยกรรมนั้นมีความสำคัญที่สุดเมื่อคุณได้เห็นมันแก้ปัญหาจริง

สิ่งนี้จะมีลักษณะอย่างไรในทางปฏิบัติ?

ทีมข้อมูลของ AstraZeneca เผชิญกับงานค้างสะสมของไฟล์ PDF จากการทดลองทางคลินิกจำนวน 400,000 ไฟล์ ซึ่งจำเป็นต้องมีการสกัดข้อมูลอย่างเป็นระบบเพื่อการยื่นเอกสารตามข้อกำหนดทางการกำกับดูแล การตรวจสอบด้วยมือจะใช้เวลาหลายเดือน

พวกเขาได้กำหนดค่าตัวแทนการสกัดข้อมูลใน Agent Bricks ชี้ไปที่คลังเอกสาร และปล่อยให้ระบบสร้างตัวอย่างสังเคราะห์ตามโครงร่างของโปรโตคอลการทดลอง ตัวแทนได้แยกวิเคราะห์ไฟล์ทั้งหมด 400,000 ไฟล์ในเวลาไม่ถึง 60 นาทีโดยไม่ต้องใช้โค้ด

  1. ทีมระบุจุดคอขวดในการดึงข้อมูลและกำหนดเวลาตามข้อบังคับ
  2. เชื่อมต่อ Agent Bricks เข้ากับแหล่งข้อมูลเอกสารภายในผ่าน Unity Catalog
  3. แพลตฟอร์มดำเนินการปรับประสิทธิภาพ โดยสร้างเกณฑ์มาตรฐานเฉพาะงานและเลือกโมเดลที่ได้รับการปรับแต่งอย่างละเอียด
  4. ปรับใช้เอเจนต์ในสภาพแวดล้อมการผลิต ลดเวลาการทำงานด้วยตนเองจากหลายสัปดาห์เหลือไม่ถึงหนึ่งชั่วโมง

Hawaiian Electricพบผลลัพธ์ที่คล้ายกันเมื่อพวกเขาเปลี่ยนโซลูชันที่เปราะบางซึ่งใช้ LangChainมาเป็น Agent Bricks สำหรับการสืบค้นเอกสารทางกฎหมาย

ตัวแทนใหม่มีประสิทธิภาพเหนือกว่าเครื่องมือเดิมอย่างมีนัยสำคัญในด้านความถูกต้องของคำตอบทั้งในการประเมินโดยอัตโนมัติและโดยมนุษย์ ทำให้พนักงานมีความมั่นใจในการใช้เครื่องมือนี้สำหรับการตรวจสอบการปฏิบัติตามข้อกำหนด

การผสานรวมและความสอดคล้องของระบบนิเวศ

เอเจนต์ Bricks สืบทอดเลเยอร์การผสานรวมของ Databricks ดังนั้นจึงสามารถเชื่อมต่อโดยตรงกับแพลตฟอร์มที่ทีมข้อมูลและทีม ML ของคุณใช้งานอยู่แล้ว

Unity Catalog ทำหน้าที่เป็นศูนย์กลางการกำกับดูแลหลัก บริหารจัดการการเข้าถึงข้อมูลจาก data lake, warehouse และ vector store ทั้งหมดภายใต้กรอบนโยบายเดียว

ตัวแทนสามารถสอบถามข้อมูลจากตาราง Delta, ไฟล์ Parquet หรือเอกสารที่จัดเก็บไว้ในเลคเฮาส์ได้โดยไม่ต้องคัดลอกข้อมูลไปยังบริการภายนอก

แพลตฟอร์ม/พันธมิตรลักษณะของการบูรณาการ
แคตตาล็อกเอกภาพการบริหารจัดการแบบรวมศูนย์สำหรับข้อมูล, แบบจำลอง, และผลลัพธ์ของตัวแทน
นีออนเซิร์ฟเวอร์เลส Postgres สำหรับเวิร์กโฟลว์ตัวแทนธุรกรรม
เทคตันการให้บริการฟีเจอร์แบบเรียลไทม์ด้วยความหน่วงต่ำกว่า 100 มิลลิวินาที
โอเพ่นเอไอการเข้าถึง GPT-5 บนข้อมูลองค์กรโดยตรง

นักพัฒนาโต้ตอบกับ Agent Bricks ผ่านทาง Databricks APIs และ SDKs มาตรฐานฟังก์ชัน ai_query SQLช่วยให้ผู้วิเคราะห์สามารถเรียกใช้ LLMs ได้โดยตรงในคำสั่งค้นหา และ REST endpoints ให้บริการตัวแทนผ่านโครงสร้างพื้นฐาน Model Serving

การผสานรวม IDE รองรับ CI/CD pipelines ทำให้วิศวกรสามารถควบคุมเวอร์ชันของการกำหนดค่าเอเจนต์ควบคู่ไปกับโค้ดแอปพลิเคชันได้

การเข้าซื้อกิจการ Tectonที่กำลังจะเกิดขึ้นจะฝังร้านค้าฟีเจอร์ออนไลน์เข้าไปใน Agent Bricks ซึ่งจะส่งข้อมูลสตรีมมิ่งไปยังตัวแทนด้วยความหน่วงต่ำกว่า 10 มิลลิวินาที

ความสามารถนั้นปลดล็อกการตรวจจับการฉ้อโกง การปรับให้เป็นส่วนบุคคล และกรณีการใช้งานอื่นๆ ที่ต้องอาศัยข้อมูลที่ทันสมัยที่สุด

สำหรับตอนนี้ ทีมสามารถสร้างต้นแบบด้วยฟีเจอร์แบบกลุ่มและวางแผนที่จะเปลี่ยนไปใช้ข้อมูลแบบเรียลไทม์เมื่อการผสานรวมเริ่มใช้งานจริงในช่วงกลางปี 2026

กระแสตอบรับจากชุมชนและความคิดเห็นของผู้ใช้กลุ่มแรก

ข้อเสนอแนะเบื้องต้นแบ่งออกระหว่างความกระตือรือร้นต่อความสะดวกในการใช้งานและความระมัดระวังเกี่ยวกับข้อจำกัดของเวอร์ชันเบต้า

ผู้ใช้ Reddit คนหนึ่งได้ชื่นชมเครื่องมือสร้างตัวแทนแบบไม่ต้องเขียนโค้ดและการผสานรวมอย่างแน่นแฟ้นกับ Unity Catalog โดยระบุว่าตัวแทนจะสืบทอดสิทธิ์การเข้าถึงข้อมูลโดยอัตโนมัติ

ผู้ใช้คนเดียวกันได้แจ้งว่า การรันการปรับแต่งประสิทธิภาพเต็มรูปแบบโดยทั่วไปใช้เวลาเกินหนึ่งชั่วโมง และมีค่าใช้จ่ายในการคำนวณเกิน $100 ซึ่งอาจสะสมได้ระหว่างการทดลอง

  • "มันทำให้ขั้นตอนการทำงานของเราง่ายขึ้นอย่างมากและลดการปรับแต่งด้วยมือ"Reddit
  • "ต้นทุนต่อการปรับปรุงประสิทธิภาพในแต่ละรอบอาจสูงในช่วงเบต้า"Reddit
  • "การเข้าถึงเนื้อหาภายในอย่างปลอดภัยสร้างความไว้วางใจในแพลตฟอร์ม"ชุมชน Databricks

ความพร้อมใช้งานในแต่ละภูมิภาคก่อให้เกิดความขัดแย้งสำหรับทีมในยุโรป ตัวแทนบัญชีของ Databricks ยืนยันในช่วงกลางปี 2025 ว่า Agent Bricks มีให้บริการเฉพาะในสหรัฐอเมริกาเท่านั้นในช่วงทดลองใช้งานเบื้องต้น ส่งผลให้ลูกค้าบางรายต้องสร้างพื้นที่ทำงานแบบแซนด์บ็อกซ์ในภูมิภาคของสหรัฐฯ เพื่อทดสอบผลิตภัณฑ์

โพสต์ในฟอรัมยังกล่าวถึงความไม่เสถียรของการแสดงตัวอย่างและการเปลี่ยนแปลงฟีเจอร์บ่อยครั้ง ซึ่งเป็นเรื่องปกติสำหรับซอฟต์แวร์เบต้า แต่ควรวางแผนรองรับหากกรณีการใช้งานของคุณต้องการความต่อเนื่องในการใช้งานสูง

เมื่อพิจารณาโดยรวมแล้ว ผู้ที่นำเทคโนโลยีมาใช้ในระยะแรกซึ่งสามารถรับมือกับข้อบกพร่องของเวอร์ชันเบต้าและคำนวณต้นทุนได้ จะเห็นคุณค่าในความสามารถของระบบอัตโนมัติที่ Agent Bricks มอบให้ การวิเคราะห์เอกสารจำนวน 400,000 ฉบับของ AstraZeneca และประสิทธิภาพที่ Hawaiian Electric ได้รับ ล้วนเป็นตัวอย่างที่สร้างความเชื่อมั่นในหมู่ชุมชนว่าแพลตฟอร์มนี้สามารถรองรับงานในระดับการผลิตจริงได้

การยืนยันจากโลกจริงมีความสำคัญเมื่อคุณกำลังตัดสินใจว่าจะลงทุนเวลาทางวิศวกรรมตอนนี้หรือรอให้ผลิตภัณฑ์เติบโตเต็มที่ก่อน

แผนที่ทาง & มุมมองระบบนิเวศ

Databricks กำลังขยาย Agent Bricks ทั้งในเชิงภูมิศาสตร์และฟังก์ชันการทำงานในช่วง 18 เดือนข้างหน้า ภายในไตรมาสที่ 4 ของปี 2025 การทดลองใช้งานจะเริ่มเปิดตัวในภูมิภาคยุโรป โดยเริ่มจากการติดตั้งบน Azure ในยุโรปตะวันตก

การเปิดตัวแบบเป็นขั้นตอนช่วยให้บริษัทสามารถรวบรวมความคิดเห็นจากผู้ใช้ที่หลากหลายและรับรองการปฏิบัติตามข้อบังคับด้านข้อมูลของแต่ละภูมิภาคก่อนที่จะประกาศให้บริการทั่วไป

การผสานรวม Tectonในกลางปี 2026 จะช่วยให้ตัวแทนสามารถดึงคุณสมบัติแบบเรียลไทม์จากสตรีม, API, และคลังข้อมูลได้พร้อมเวลาทำงาน 99.99% ซึ่งช่วยให้สามารถตรวจจับการฉ้อโกงและใช้กรณีการปรับแต่งให้เหมาะกับบุคคลที่ต้องการข้อมูลแบบเรียลไทม์ได้

นีออนและมูนเค้กจะรวมเป็นประสบการณ์ "Lakehouse DB" แบบรวมหนึ่งเดียว มอบการเขียนข้อมูลที่สอดคล้องกับมาตรฐาน ACID และการอ่านข้อมูลเพื่อการวิเคราะห์ได้ทันทีโดยไม่ต้องใช้ ETL pipelines ให้กับตัวแทน

"เอเจนต์บล็อคส์ส่งสัญญาณการเปลี่ยนแปลงครั้งใหญ่ในเอไอสำหรับองค์กร" นักวิเคราะห์จากVentureBeat กล่าว พร้อมชี้ให้เห็นถึงการเพิ่มขึ้นของประสิทธิภาพถึง 10 เท่าถึง 100 เท่า จากการกำจัดระบบท่อข้อมูลแบบดั้งเดิม

คาดหวังแม่แบบตัวแทนใหม่เพิ่มเติมจากสี่ประเภทเริ่มต้น (การสกัดข้อมูล, ผู้ช่วยความรู้, ผู้ควบคุมหลายตัวแทน, ตัวแทน LLM แบบกำหนดเอง)

การวิจัยของ Databricks กำลังสำรวจผู้ช่วยเขียนโค้ด ตัววางแผน และตัวเชื่อมต่อกับ API ภายนอกความร่วมมือกับ OpenAIช่วยให้มั่นใจได้ว่าเมื่อ OpenAI เปิดตัว GPT-5 และโมเดลในอนาคต พวกเขาจะสามารถใช้งานได้โดยตรงใน Agent Bricks พร้อมการสนับสนุนและการกำกับดูแลจากเจ้าของผลิตภัณฑ์

ในระยะยาว Databricks มองว่า AI แบบตัวแทนจะเป็นบุคลิกผู้ใช้ใหม่บนแพลตฟอร์ม ทำงานเคียงข้างกับวิศวกรข้อมูลและนักวิเคราะห์ วิสัยทัศน์นี้รวมถึงการลงทุนอย่างต่อเนื่องในฟีเจอร์ AI ที่มีความรับผิดชอบ เช่น บันทึกการตรวจสอบ การตรวจจับอคติ และการควบคุมนโยบายอย่างละเอียด เมื่อการนำ AI แบบตัวแทนไปใช้ในอุตสาหกรรมที่มีการกำกับดูแลเพิ่มขึ้น

Databricks Agentic AI มีค่าใช้จ่ายเท่าไร?

Agent Bricks ใช้โมเดลการกำหนดราคาตามการใช้งานของ Databricks โดยไม่มีค่าธรรมเนียมใบอนุญาตเริ่มต้น คุณจ่ายตามวินาทีของการประมวลผลและการอนุมานของโมเดล โดยเรียกเก็บเงินเป็นหน่วย Databricks (DBUs)

งานโหลดการทำงานของโมเดลและการให้บริการฟีเจอร์มีค่าใช้จ่ายประมาณ $0.07 ต่อ DBU-second ในแผนพรีเมียม ซึ่งรวมค่าใช้จ่ายของอินสแตนซ์คลาวด์พื้นฐานแล้ว การอนุมานที่เร่งด้วย GPU สำหรับโมเดลพื้นฐานก็มีค่าใช้จ่ายใกล้เคียงกันที่ $0.07 ต่อ DBU-second

ภาพหน้าจอแสดงราคาของ Databricks

ส่วนที่เข้มข้นคือการรันการปรับแต่งเริ่มต้น ผู้ใช้รายหนึ่งรายงานว่าใช้เงินมากกว่า $100 ในการประมวลผลบนคลาวด์สำหรับการฝึกอบรมเพียงหนึ่งชั่วโมง ซึ่งสร้างข้อมูลสังเคราะห์และปรับแต่งตัวแทน

หลังจากการปรับแต่งประสิทธิภาพแล้ว การให้บริการกับเอเจนต์จะมีค่าใช้จ่ายถูกลงมาก เนื่องจากระบบได้ระบุการกำหนดค่าโมเดลที่มีประสิทธิภาพด้านต้นทุนซึ่งยังคงรักษาคุณภาพไว้ได้โดยใช้โทเค็นต่อคำขอข้อมูลน้อยลง ทีมงานสามารถกำหนดขีดจำกัดงบประมาณผ่านนโยบายงบประมาณของ Databricks เพื่อควบคุมค่าใช้จ่ายในระหว่างการทดลองได้

ลูกค้าองค์กรสามารถซื้อแพ็กเกจการผูกมัด(ชั่วโมง DBU ที่ชำระล่วงหน้า) เพื่อรับส่วนลดตามปริมาณ ซึ่งช่วยลดอัตราต่อวินาทีเมื่อเทียบกับการเรียกเก็บเงินตามการใช้งานจริง ราคาที่แน่นอนจะปรับตามผู้ให้บริการคลาวด์ของคุณ (AWS, Azure, GCP) และภูมิภาค โดยบางภูมิภาคอาจมีราคาสูงกว่าภูมิภาค US East หรือ West เล็กน้อย

ค่าใช้จ่ายที่ซ่อนอยู่ที่ควรระวัง ได้แก่ การประมวลผลสำหรับการค้นหาแบบเวกเตอร์ การนำเข้าข้อมูล และการฝึกฝนใหม่เป็นระยะเมื่อการกระจายข้อมูลของคุณเปลี่ยนแปลง ควรคำนึงถึงเวลาทางวิศวกรรมที่ประหยัดได้จากการไม่ต้องปรับแต่งคำสั่งและติดป้ายข้อมูลด้วยตนเองเมื่อคำนวณต้นทุนรวมในการเป็นเจ้าของ

ผู้ใช้งานกลุ่มแรกเริ่มรายงานว่าสัปดาห์ที่ต้องทำงานด้วยตนเองซึ่ง Agent Bricks ช่วยลดไปได้นั้น มักจะคุ้มค่ากับค่าใช้จ่ายในการประมวลผล โดยเฉพาะเมื่อพิจารณาถึงต้นทุนค่าเสียโอกาสจากการติดตั้งเอเจนต์ที่ล่าช้า