Safe, Untrusted, "Proof-Carrying" AI Agents: toward the agentic lakehouse
Tagliabue, Greco
Data lakehouses run sensitive workloads, where AI-driven automation raises concerns about trust, correctness, and governance. We argue that API-first, programmable lakehouses provide the right abstractions for safe-by-design, agentic workflows. Using Bauplan as a case study, we show how data branching and declarative environments extend naturally to agents, enabling reproducibility and observability while reducing the attack surface. We present a proof-of-concept in which agents repair data pipelines using correctness checks inspired by proof-carrying code. Our prototype demonstrates that untrusted AI agents can operate safely on production data and outlines a path toward a fully agentic lakehouse.
academic
وكلاء ذكاء اصطناعي آمنة وغير موثوقة و"تحمل الإثبات": نحو بحيرة البيانات الوكيلة
تدير بحيرات البيانات (Data Lakehouse) أحمالاً عملية حساسة، مما يثير مخاوف بشأن الثقة والصحة والحوكمة من الأتمتة المدفوعة بالذكاء الاصطناعي. تجادل هذه الورقة بأن بحيرات البيانات القابلة للبرمجة الموجهة بواسطة واجهات برمجية توفر التجريد الصحيح لسير عمل الوكلاء المصمم بأمان. باستخدام Bauplan كدراسة حالة، نوضح كيف يمكن لفروع البيانات والبيئات الإعلانية أن تتوسع بشكل طبيعي إلى الوكلاء، مما يحقق إمكانية إعادة الإنتاج والملاحظة مع تقليل سطح الهجوم. نقترح نموذج إثبات المفهوم حيث يستخدم الوكلاء فحوصات الصحة المستوحاة من الكود الذي يحمل الإثبات لإصلاح خطوط أنابيب البيانات. يوضح النموذج الأولي أن وكلاء الذكاء الاصطناعي غير الموثوقين يمكنهم العمل بأمان على بيانات الإنتاج، ويحدد المسار نحو بحيرة بيانات وكيلة بالكامل.
المشكلة الأساسية: مع تحسن قدرات الاستدلال بنموذج اللغة الكبيرة واستخدام الأدوات، كيف يمكن السماح لوكلاء الذكاء الاصطناعي بإدارة دورة حياة البيانات في بحيرات البيانات بأمان، خاصة في بيئات الإنتاج الحساسة؟
تحليل التحديات:
بحيرات البيانات هي أنظمة موزعة مبنية للتعاون بين فرق بشرية، وتتعامل مع بيانات الإنتاج الحساسة، وغير مناسبة للأتمتة الشاملة
عدم التجانس في المنصات يجعل أولويات حالات الاستخدام للوكلاء غير واضحة
الأنظمة التقليدية تقاوم الأتمتة بسبب عدم تجانس الواجهات وأنماط الوصول المعقدة
الاحتياجات الواقعية:
يقضي مهندسو البيانات وقتاً طويلاً في إصلاح خطوط أنابيب البيانات
إصلاح خطوط الأنابيب هو حالة اختبار لسيناريوهات عالية المخاطر وغير تافهة
تصميم التجريد: تقديم تجريدات لنمذجة دورة حياة البيانات في بحيرات البيانات القابلة للبرمجة، مع بناء وتنفيذ خطوط أنابيب سحابية بالكامل من خلال الكود
إطار العمل الأمني: مراجعة ومعالجة الاعتراضات الشائعة على أتمتة الأحمال العملية عالية المخاطر، والجدال بأن النماذج تعزز الموثوقية والصحة فيما يتعلق بقطع البيانات والكود
التنفيذ الأولي: إطلاق كود عامل يوضح نموذج إثبات المفهوم لخطوط أنابيب ذاتية الإصلاح باستخدام Bauplan كبحيرة بيانات ودورة وكيل
تخطيط المسار: تحديد الخطوات العملية اللاحقة لتحقيق بحيرة بيانات وكيلة بالكامل بناءً على النموذج الأولي
محاكاة الأعطال: بناءً على التقارير الصناعية والخبرة، محاكاة مشاكل عدم تطابق الحزم حول إصدار NumPy 2.0، مما يؤدي إلى انهيار الحاويات التي تستخدم pandas 2.0.
بحيرات البيانات القابلة للبرمجة مناسبة بشكل طبيعي للوكلاء: يعتبر الرسم البياني الموجه غير الدوري الإعلاني وإدارة البيانات الشبيهة بـ Git مناسباً جداً لدعم استخدام الوكلاء المصمم بأمان
يمكن ضمان الأمان: من خلال التجريدات المناسبة وآليات التحقق، يمكن لوكلاء الذكاء الاصطناعي غير الموثوقين العمل بأمان على بيانات الإنتاج
تم التحقق من العملية: أثبت النموذج الأولي بنجاح القدرة على إصلاح خطوط أنابيب البيانات في سيناريوهات حقيقية
تستشهد الورقة بـ 24 مرجعاً ذا صلة، تغطي بشكل أساسي:
معمارية بحيرات البيانات (Zaharia وآخرون، 2021)
استخدام أدوات وكيل الذكاء الاصطناعي (Shen، 2024)
الكود الذي يحمل الإثبات (Necula و Lee، 1998)
تحديات هندسة البيانات (Data World، 2021)
البنية التحتية القابلة للبرمجة (Tagliabue وآخرون، 2024)
التقييم الشامل: هذه ورقة منظمة ذات قيمة عملية مهمة، وهي أول معالجة منظمة للتطبيق الآمن لوكلاء الذكاء الاصطناعي في بيئة بحيرات البيانات. تجمع الورقة بين الابتكار النظري والتنفيذ العملي، وتوفر أفكاراً وأدوات جديدة لأتمتة هندسة البيانات. على الرغم من وجود مجال للتحسين في شمولية التقييم وقابلية النقل، فإن عملها الرائد والمساهمات مفتوحة المصدر تمنحها قيمة أكاديمية وصناعية مهمة.