Safe, Untrusted, "Proof-Carrying" AI Agents: toward the agentic lakehouse
Tagliabue, Greco
Data lakehouses run sensitive workloads, where AI-driven automation raises concerns about trust, correctness, and governance. We argue that API-first, programmable lakehouses provide the right abstractions for safe-by-design, agentic workflows. Using Bauplan as a case study, we show how data branching and declarative environments extend naturally to agents, enabling reproducibility and observability while reducing the attack surface. We present a proof-of-concept in which agents repair data pipelines using correctness checks inspired by proof-carrying code. Our prototype demonstrates that untrusted AI agents can operate safely on production data and outlines a path toward a fully agentic lakehouse.
academic
Безопасные, Ненадежные "Агенты с Доказательством": к агентивному озеру данных
Озера данных (Data Lakehouse) обрабатывают конфиденциальные рабочие нагрузки, и автоматизация на основе ИИ вызывает опасения относительно доверия, корректности и управления. В данной статье утверждается, что API-ориентированное программируемое озеро данных предоставляет правильную абстракцию для безопасного проектирования рабочих процессов агентов. На примере Bauplan демонстрируется, как ветвление данных и декларативная среда естественным образом расширяются на агентов, обеспечивая воспроизводимость и наблюдаемость при одновременном снижении поверхности атаки. Предложено доказательство концепции, в котором агенты используют проверки корректности, вдохновленные кодом с доказательством, для исправления конвейеров данных. Прототип демонстрирует, что ненадежные ИИ-агенты могут безопасно работать с производственными данными, и намечает путь к полностью агентивному озеру данных.
Основная проблема: С улучшением способностей рассуждения LLM и использования инструментов, как позволить ИИ-агентам безопасно управлять жизненным циклом данных в озере данных, особенно в конфиденциальных производственных средах?
Анализ вызовов:
Озера данных построены для сотрудничества человеческих команд, обрабатывают конфиденциальные производственные данные и не подходят для сквозной автоматизации
Гетерогенность платформ делает приоритеты применения агентов неясными
Традиционные системы сопротивляются автоматизации из-за гетерогенности интерфейсов и сложных паттернов доступа
Практические требования:
Инженеры данных тратят значительное время на исправление конвейеров данных
Исправление конвейеров является пробным камнем для высокорисковых нетривиальных сценариев
Необходимо достичь автоматизации при гарантии безопасности
Проектирование абстракции: Введены абстракции для моделирования жизненного цикла данных в программируемом озере данных с полным построением и выполнением облачных конвейеров через код
Структура безопасности: Рассмотрены и решены общие возражения против автоматизации высокорисковых рабочих нагрузок, обоснована роль моделей в содействии доверию и корректности в отношении артефактов данных и кода
Реализация прототипа: Выпущен рабочий код, демонстрирующий самоисправляющиеся конвейеры как доказательство концепции с использованием Bauplan в качестве озера данных и цикла агента
Планирование пути: На основе прототипа намечены практические последующие шаги для реализации полностью агентивного озера данных
Моделирование сбоев: На основе отраслевых отчетов и опыта моделируется несоответствие пакетов вокруг выпуска NumPy 2.0, приводящее к сбою контейнеров с использованием pandas 2.0.
Программируемые озера данных естественно подходят для агентизации: Декларативные DAG и управление данными, подобное Git, идеально подходят для поддержки безопасно спроектированного использования агентами
Безопасность может быть гарантирована: Благодаря надлежащим абстракциям и механизмам проверки ненадежные ИИ-агенты могут безопасно работать с производственными данными
Практичность подтверждена: Прототип успешно демонстрирует способность исправлять конвейеры данных в реальных сценариях
Статья цитирует 24 связанные работы, охватывающие в основном:
Архитектуру озер данных (Zaharia и др., 2021)
Использование инструментов ИИ-агентами (Shen, 2024)
Код с доказательством (Necula & Lee, 1998)
Вызовы инженерии данных (Data World, 2021)
Программируемую инфраструктуру (Tagliabue и др., 2024)
Общая оценка: Это систематическая статья с важной практической ценностью, которая впервые систематически исследует безопасное применение ИИ-агентов в среде озера данных. Статья сочетает теоретические инновации и практическую реализацию, предоставляя новые идеи и инструменты для автоматизации инженерии данных. Хотя есть место для улучшения в полноте оценки и универсальности, ее новаторская работа и вклад в открытый исходный код придают ей значительную академическую и промышленную ценность.