2025-11-23T20:34:17.570355

Causal Explanation of Concept Drift -- A Truly Actionable Approach

Komnick, Lammers, Hammer et al.

In a world that constantly changes, it is crucial to understand how those changes impact different systems, such as industrial manufacturing or critical infrastructure. Explaining critical changes, referred to as concept drift in the field of machine learning, is the first step towards enabling targeted interventions to avoid or correct model failures, as well as malfunctions and errors in the physical world. Therefore, in this work, we extend model-based drift explanations towards causal explanations, which increases the actionability of the provided explanations. We evaluate our explanation strategy on a number of use cases, demonstrating the practical usefulness of our framework, which isolates the causally relevant features impacted by concept drift and, thus, allows for targeted intervention.

academic

Причинное объяснение дрейфа концепции -- подлинно действенный подход

Основная информация

ID статьи: 2507.23389
Название: Causal Explanation of Concept Drift -- A Truly Actionable Approach
Авторы: David Komnick, Kathrin Lammers, Barbara Hammer, Valerie Vaquet, Fabian Hinder (Университет Билефельда)
Классификация: cs.LG (Машинное обучение)
Время публикации/конференция: Семинар TempXAI на ECML-PKDD 2025
Ссылка на статью: https://arxiv.org/abs/2507.23389

Аннотация

В постоянно меняющемся мире критически важно понимать, как эти изменения влияют на различные системы, такие как промышленное производство или критическая инфраструктура. Объяснение ключевых изменений (называемых дрейфом концепции в области машинного обучения) является первым шагом к реализации целевых вмешательств для предотвращения или исправления отказов моделей и ошибок в физическом мире. Таким образом, данная статья расширяет объяснение дрейфа на основе модели до причинного объяснения, повышая действенность предоставляемых объяснений. Авторы оценивают стратегию объяснения на нескольких вариантах использования, демонстрируя практичность предложенной структуры, которая способна разделять причинно-связанные признаки, подверженные дрейфу концепции, позволяя осуществлять целевые вмешательства.

Исследовательский контекст и мотивация

Определение проблемы

Проблема дрейфа концепции: в практических приложениях распределение данных изменяется с течением времени, это явление называется дрейфом концепции и приводит к снижению производительности моделей машинного обучения
Требование объяснимости: простого обнаружения дрейфа недостаточно; необходимо понимать причины дрейфа для принятия эффективных мер вмешательства
Отсутствие действенности: существующие методы объяснения дрейфа в основном носят исследовательский характер и не предоставляют прямого руководства по действиям

Значимость

Промышленные приложения: в критической инфраструктуре (таких как электросети, сети водоснабжения) понимание причин дрейфа критически важно для мониторинга системы и предотвращения отказов
Обслуживание моделей: точное объяснение дрейфа может направлять стратегии адаптации и улучшения моделей
Поддержка принятия решений: предоставление операторам действенных объяснений для поддержки автономных программ или решений о ручном вмешательстве

Ограничения существующих методов

Объяснение дрейфа на основе модели: хотя универсально, в основном сосредоточено на исследовательских методах объяснения
Методы важности признаков: не обладают способностью причинного вывода, не могут предоставить прямое руководство по вмешательству
Ограниченные исследования причинного объяснения дрейфа: соответствующих работ очень мало, и они в основном сосредоточены на задачах прогнозирования или обнаружения

Основные вклады

Теоретическая структура: расширение структуры объяснения дрейфа на основе модели в область причинного объяснения
Математическая формализация: предоставление строгого математического определения вмешательства по обращению дрейфа (drift-reversing intervention)
Реализация алгоритма: предложение практического алгоритма причинного объяснения дрейфа, основанного на методах причинного обнаружения
Экспериментальная проверка: проверка эффективности и стабильности метода на полусинтетических наборах данных

Подробное описание методологии

Определение задачи

Входные данные: поток данных с временными метками S = ((X₁, T₁), (X₂, T₂), ...) Выходные данные:

Набор основных признаков вмешательства C (прямые потомки временного узла)
Набор условных признаков P (другие родители основных признаков)
Полный набор признаков вмешательства A (основные признаки и все их предки)

Теоретические основы

Причинное моделирование дрейфа концепции

Статья формализует дрейф концепции как отношение зависимости между данными и временем:

Определение 1 (Дрейф концепции): процесс распределения (P_T, D_t) содержит дрейф тогда и только тогда, когда:

Существуют s, t такие, что D_t ≠ D_s с положительной вероятностью
Данные X и время T не независимы

Причинные модели и вмешательства

На основе байесовских сетей и do-исчисления:

Байесовская сеть: (G, P_f), где G — ориентированный ациклический граф, P_f — набор условных распределений
do-операция: P_G(· | do(X_F = x)) обозначает распределение после вмешательства в признак F
Причинная модель: если сеть согласуется со всеми предсказаниями вмешательств и экспериментальными результатами

Вмешательство по обращению дрейфа

Определение 5: набор признаков F обеспечивает вмешательство по обращению дрейфа тогда и только тогда, когда путем управления значениями признаков в F можно произвести эффект, эквивалентный изменению временного потока.

Основные теоремы

Теорема 2: в верной причинной модели:

Временной узел не имеет родителей
Временной узел имеет потомков тогда и только тогда, когда существует дрейф
Каждый набор для обращения дрейфа должен содержать всех прямых потомков временного узла
Все прямые потомки временного узла и их предки составляют набор для обращения дрейфа

Теорема 3: минимальный набор признаков, которые необходимо изменить, состоит ровно из всех прямых потомков временного узла.

Реализация алгоритма

Алгоритм 1: Причинное объяснение дрейфа
Входные данные: S = ((X₁, T₁), ...) поток данных
1. G ← DetermineDAG(S)  // запуск алгоритма причинного обнаружения
2. C ← GetChildren(G, f_T)  // получение потомков временного узла
3. P ← ∪_{f∈C} GetParents(G, f) \ ({f_T} ∪ C)
4. A ← ∪_{f∈C} GetAncesters(G, f) \ {f_T}
5. return (C, P, A)

Экспериментальная установка

Наборы данных

Полусинтетические наборы данных, построенные на основе наборов данных Adult и Portuguese Student Performance:

Сценарии набора данных Adult:

Adult Inflation: инфляция приводит к увеличению вероятности высоких денежных значений
Adult Women in STEM: женщины с большей вероятностью работают в STEM

Сценарии набора данных Student:

Student Girls Support: студентки участвуют в программе поддержки
Student Boys Support: студенты-мужчины участвуют в программе поддержки

Размер данных:

Adult: примерно 48 800 образцов, точка дрейфа на 25 000
Student: 5 000 образцов, точка дрейфа на 2 000

Методы оценки

Точность восстановления причинной структуры: сравнение обнаруженных ребер с истинным причинным графом
Стабильность идентификации признаков дрейфа: оценка согласованности идентификации потомков временного узла
10 независимых экспериментов: оценка стабильности результатов

Детали реализации

Использование алгоритма PC из пакета Python causal-learn
Применение g-square теста независимости
Параметры по умолчанию

Результаты экспериментов

Анализ производительности алгоритма PC

Набор данных Adult:

Коэффициент правильного обнаружения: 50% (19/38 ребер)
9 ребер с неправильным направлением, 10 ребер не обнаружено

Набор данных Student:

Коэффициент правильного обнаружения: 30,77% (8/26 ребер)
Худшая производительность в основном из-за недостаточного количества образцов относительно количества признаков

Результаты объяснения дрейфа

Сценарий Adult Women in STEM

Коэффициент успеха: в 9 из 10 экспериментов правильно идентифицирован occupation как признак дрейфа
Временное отношение: T обнаружен как родитель occupation
Стабильность: обнаружение других предков согласуется с данными без дрейфа

Сценарий Adult Inflation

Дрейф нескольких признаков: в 8 из 10 экспериментов правильно идентифицированы все три признака дрейфа (capital-gain, capital-loss, income)
Влияние корреляции: в 2 экспериментах capital-gain не был обнаружен из-за сильной корреляции между признаками

Сценарий Student Support

Высокая точность: несмотря на низкое качество восстановления общего причинного графа, во всех экспериментах правильно идентифицирован schoolsup как единственный признак дрейфа
Условные признаки: правильно идентифицирован sex как условная переменная

Ключевые выводы

Отсутствие ложных срабатываний: временной признак никогда не связывался с несвязанными признаками
Надежное обнаружение сильного дрейфа: даже при низком качестве данных сильный дрейф концепции надежно обнаруживается
Стабильность: идентификация признаков дрейфа в большинстве случаев показывает стабильные результаты

Связанные работы

Объяснение дрейфа концепции

Методы визуализации: в основном сосредоточены на обнаружении и количественной оценке дрейфа
Объяснение на уровне признаков: предоставление анализа дрейфа на уровне признаков
Объяснение на основе модели: использование суррогатных моделей для расчета объяснений

Причинное объяснение дрейфа

Ограниченные исследования: соответствующих работ очень мало
Методы сравнения DAG: сравнение причинных моделей до и после дрейфа
Алгоритм NOTEARS: онлайн-метод для причинного обнаружения

Теория релевантности признаков

Признаки, вызывающие дрейф: признаки, вызывающие дрейф
Верные признаки дрейфа: признаки, следующие за дрейфом
Граница Маркова: связь с теоретической структурой данной работы

Заключение и обсуждение

Основные выводы

Теоретический вклад: успешное введение причинного вывода в объяснение дрейфа концепции
Практичность: предоставление прямого руководства по действенному вмешательству
Стабильность: надежная идентификация признаков дрейфа даже при плохой производительности алгоритма причинного обнаружения

Ограничения

Зависимость от причинного обнаружения: эффективность метода ограничена точностью базового алгоритма причинного обнаружения
Предположение единого причинного графа: предположение, что весь набор данных может быть описан одним причинным графом
Требования к данным: требуется достаточное количество образцов для поддержки надежного тестирования независимости

Направления будущих исследований

Интеграция теории релевантности признаков: исследование взаимосвязи между причинным обнаружением и релевантностью признаков для снижения требований к данным
Локальные объяснения: предоставление более локализованных объяснений для конкретных подгрупп
Расширение на несколько причинных графов: обработка сложных сценариев, требующих нескольких причинных графов

Глубокая оценка

Преимущества

Теоретическая строгость: предоставление полной математической структуры с строгими доказательствами от определений до теорем
Высокая инновационность: первая систематическая интеграция причинного вывода и объяснения дрейфа концепции
Высокая практическая ценность: предоставление прямого руководства по вмешательству с подлинной действенностью
Разумный дизайн экспериментов: использование полусинтетических данных для обеспечения доступности истинных значений

Недостатки

Ограниченный масштаб экспериментов: тестирование только на вариантах двух наборов данных
Единственный алгоритм причинного обнаружения: в основном полагается на алгоритм PC без исследования эффектов других алгоритмов
Недостаточная проверка в реальном мире: отсутствие проверки в реальных промышленных сценариях
Отсутствие анализа вычислительной сложности: отсутствие подробного анализа временной и пространственной сложности алгоритма

Влияние

Академический вклад: открытие нового направления исследований в области объяснения дрейфа концепции
Практическая ценность: предоставление новых инструментов для мониторинга критической инфраструктуры
Воспроизводимость: предоставление открытого исходного кода для облегчения воспроизведения и расширения

Применимые сценарии

Промышленный мониторинг: электросети, сети водоснабжения и другая критическая инфраструктура
Контроль качества: мониторинг качества продукции в производстве
Финансовый риск-менеджмент: анализ дрейфа моделей кредитной оценки
Медицинская диагностика: анализ применимости диагностических моделей в различных популяциях

Библиография

Статья цитирует 30 соответствующих источников, включая:

Классические работы по обнаружению и адаптации дрейфа концепции (Gama et al., 2014)
Обзорные статьи по интерпретируемому ИИ (Adadi & Berrada, 2018)
Фундаментальные теории причинного вывода (Pearl, 2009)
Структуру объяснения дрейфа на основе модели (Hinder et al., 2023)

Данная работа вносит важные вклады как на теоретическом, так и на практическом уровнях, предоставляя совершенно новую причинную перспективу на объяснение дрейфа концепции с важной академической ценностью и практическим значением. Несмотря на некоторые ограничения, она закладывает прочную основу для будущих исследований.