2025-11-12T13:34:14.831387

Efficient & Correct Predictive Equivalence for Decision Trees

Marques-Silva, Ignatiev
The Rashomon set of decision trees (DTs) finds importance uses. Recent work showed that DTs computing the same classification function, i.e. predictive equivalent DTs, can represent a significant fraction of the Rashomon set. Such redundancy is undesirable. For example, feature importance based on the Rashomon set becomes inaccurate due the existence of predictive equivalent DTs, i.e. DTs with the same prediction for every possible input. In recent work, McTavish et al. proposed solutions for several computational problems related with DTs, including that of deciding predictive equivalent DTs. The approach of McTavish et al. consists of applying the well-known method of Quine-McCluskey (QM) for obtaining minimum-size DNF (disjunctive normal form) representations of DTs, which are then used for comparing DTs for predictive equivalence. Furthermore, the minimum-size DNF representation was also applied to computing explanations for the predictions made by DTs, and to finding predictions in the presence of missing data. However, the problem of formula minimization is hard for the second level of the polynomial hierarchy, and the QM method may exhibit worst-case exponential running time and space. This paper first demonstrates that there exist decision trees that trigger the worst-case exponential running time and space of the QM method. Second, the paper shows that the QM method may incorrectly decide predictive equivalence, if two key constraints are not respected, and one may be difficult to formally guarantee. Third, the paper shows that any of the problems to which the smallest DNF representation has been applied to can be solved in polynomial time, in the size of the DT. The experiments confirm that, for DTs for which the worst-case of the QM method is triggered, the algorithms proposed in this paper are orders of magnitude faster than the ones proposed by McTavish et al.
academic

Équivalence Prédictive Efficace et Correcte pour les Arbres de Décision

Informations Fondamentales

  • ID de l'article : 2509.17774
  • Titre : Efficient & Correct Predictive Equivalence for Decision Trees
  • Auteurs : João Marques-Silva (ICREA & University of Lleida), Alexey Ignatiev (Monash University)
  • Classification : cs.AI cs.LG cs.LO
  • Date de publication/Conférence : Journal of Machine Learning Research 23 (2025) 1-35
  • Lien de l'article : https://arxiv.org/abs/2509.17774

Résumé

L'ensemble de Rashomon des arbres de décision présente une valeur applicative importante. Des recherches récentes montrent que le calcul d'arbres de décision produisant la même fonction de classification (c'est-à-dire des arbres de décision prédictivement équivalents) peut constituer une part considérable de l'ensemble de Rashomon. Cette redondance est indésirable, par exemple l'importance des caractéristiques basée sur l'ensemble de Rashomon devient inexacte en raison de l'existence d'arbres de décision prédictivement équivalents. McTavish et al. ont récemment proposé une solution aux problèmes de calcul liés aux arbres de décision, y compris la détermination des arbres de décision prédictivement équivalents. Leur méthode utilise la célèbre méthode de Quine-McCluskey (QM) pour obtenir une représentation DNF minimale de l'arbre de décision, puis l'utilise pour comparer l'équivalence prédictive des arbres de décision. Cependant, le problème de minimisation de formule est difficile pour la deuxième couche de la hiérarchie polynomiale, et la méthode QM peut présenter une complexité de temps et d'espace exponentielle dans le pire cas. Cet article prouve d'abord qu'il existe des arbres de décision qui déclenchent la complexité exponentielle du pire cas de la méthode QM, montre ensuite que la méthode QM peut mal juger l'équivalence prédictive si deux contraintes clés ne sont pas satisfaites, et prouve enfin que tous les problèmes appliquant la représentation DNF minimale peuvent être résolus en temps polynomial par rapport à la taille de l'arbre de décision.

Contexte de Recherche et Motivation

Définition du Problème

Le problème fondamental abordé dans cet article est l'efficacité et la correction du jugement d'équivalence prédictive des arbres de décision. Les arbres de décision prédictivement équivalents sont des arbres de décision distincts qui produisent les mêmes résultats de prédiction pour toute entrée.

Importance du Problème

  1. Optimisation de l'ensemble de Rashomon : En apprentissage automatique, l'ensemble de Rashomon contient plusieurs modèles aux performances similaires. Les arbres de décision prédictivement équivalents créent une redondance dans cet ensemble, affectant la précision de l'évaluation de l'importance des caractéristiques.
  2. Besoins d'interprétabilité : Les arbres de décision sont largement reconnus comme des modèles interprétables, mais même les arbres optimaux nécessitent une explication formalisée, particulièrement dans les applications à haut risque.
  3. Efficacité computationnelle : Les méthodes existantes font face à des goulots d'étranglement computationnels graves lors du traitement d'arbres de décision à grande échelle.

Limitations des Méthodes Existantes

La méthode proposée par McTavish et al. basée sur l'algorithme de Quine-McCluskey (QM) présente les problèmes suivants :

  1. Complexité computationnelle : La méthode QM résout un problème Σₚ²-difficile, nécessitant un temps et un espace exponentiels dans le pire cas
  2. Problèmes de correction : Peut produire des résultats incorrects lorsque certaines contraintes spécifiques ne sont pas satisfaites
  3. Viabilité pratique : La méthode QM est connue pour avoir une très mauvaise scalabilité pour les problèmes avec des dizaines de variables

Contributions Principales

  1. Analyse théorique : Preuve de l'existence d'arbres de décision déclenchant la complexité exponentielle du pire cas de la méthode QM
  2. Analyse de correction : Révélation des problèmes potentiels de correction de la méthode QM dans le jugement d'équivalence prédictive
  3. Algorithme efficace : Proposition d'un algorithme en temps polynomial résolvant les problèmes de complétude, concision et jugement d'équivalence prédictive
  4. Validation expérimentale : Sur les arbres de décision déclenchant le pire cas QM, le nouvel algorithme est plusieurs ordres de grandeur plus rapide que les méthodes existantes
  5. Connexions théoriques : Établissement de liens théoriques entre l'équivalence prédictive et les explications logiques, les mesures d'importance

Détails de la Méthode

Définition de la Tâche

Étant donné deux arbres de décision T₁ et T₂, déterminer s'ils sont prédictivement équivalents, c'est-à-dire :

∀(x ∈ F). (κₜ₁(x) = κₜ₂(x))

où F est l'espace des caractéristiques et κ est la fonction de classification.

Cadre Technique Principal

1. Méthode d'Explication Faiblement Inductive (WAXp)

L'article propose un algorithme en temps polynomial basé sur WAXp :

Algorithme 1 : Vérification de Cohérence de Chemin

def ConsistentPath(A, P, T):
    # Vérifier la cohérence d'une affectation partielle A avec le chemin P de l'arbre
    for each feature i:
        combine literals from A and P for feature i
        if inconsistent: return False
    return True

Algorithme 2 : Jugement WAXp

def IsWAXp(A, c, T):
    # Déterminer si une affectation partielle A est un WAXp pour la classe c
    for each path P in T:
        if Class(P) != c and ConsistentPath(A, P, T):
            return False  # A est cohérente avec un chemin d'une autre classe
    return True

2. Algorithme de Jugement d'Équivalence Prédictive

Algorithme 5 : Jugement d'Équivalence Prédictive

def PredictivelyEquivalent(T1, T2):
    for P1 in Paths(T1):
        c1 = Class(P1)
        A1 = Literals(P1)  # Créer une affectation partielle
        for P2 in Paths(T2):
            c2 = Class(P2)
            if c1 != c2 and ConsistentPath(A1, P2, T2):
                return False  # Preuve de non-équivalence trouvée
    return True  # Aucune preuve de non-équivalence, donc équivalent

Points d'Innovation Technique

  1. Éviter la complexité exponentielle : Opération directe sur la structure de l'arbre de décision, évitant la génération de représentations BCF potentiellement exponentielles
  2. Garantie de temps polynomial : Tous les algorithmes ont une complexité temporelle polynomiale par rapport à la taille de l'arbre de décision
  3. Correction formalisée : Preuve mathématique rigoureuse garantissant la correction de l'algorithme
  4. Parallélisabilité : L'algorithme d'équivalence prédictive peut être parallélisé pour une efficacité accrue

Configuration Expérimentale

Cas de Test Construits

L'article utilise des constructions d'arbres de décision spéciaux basées sur le théorème 1 :

  • Paramètre r : Contrôle la complexité de l'arbre
  • Nombre de nœuds : 6r + 3 nœuds
  • Nombre de caractéristiques : 2r + 1 caractéristiques
  • Taille BCF : Pour la classe 1, limite inférieure de 2^r termes premiers implicants

Métriques d'Évaluation

  1. Temps d'exécution : Temps d'exécution de l'algorithme (secondes)
  2. Taille BCF : Nombre de termes premiers implicants dans la forme standard de Blake
  3. Scalabilité : Capacité à traiter des arbres de décision de différentes tailles

Méthodes de Comparaison

  • Implémentation QM de SymPy : Méthode de référence utilisée par McTavish et al.
  • Génération BCF indépendante : Étape de génération de termes premiers implicants QM standard implémentée par les auteurs

Détails d'Implémentation

  • Plateforme : Processeur Macbook M3 Pro
  • Langage de programmation : Python
  • Limite de temps : Limite de 150000 secondes pour la méthode QM

Résultats Expérimentaux

Résultats Principaux

Vérification de la Complexité Exponentielle de la Méthode QM

rTemps SymPy(s)|BCF₀(T)||BCF₁(T)|Temps BCF(s)
30.134220.01
40.575460.07
539.606940.84
62789.45719011.28
7>150000.008382161.25

Performance de Scalabilité du Nouvel Algorithme

rNœuds ADCaractéristiques|BCF₁(T)|Un AXpisWAXp?PE?
20012034012²⁰⁰1.71s0.005s3.7s
500300310012⁵⁰⁰26.98s0.032s57.1s
1000600320012¹⁰⁰⁰224.62s0.126s469.0s

Découvertes Clés

  1. Confirmation de la croissance exponentielle : La taille de BCF₁(T) croît exponentiellement avec r, validant l'analyse théorique
  2. Écart de performance massif : Pour r=200, le nouvel algorithme traite un arbre de décision de 1203 nœuds en quelques secondes, tandis que la méthode QM dépasse le délai d'attente avec 57 nœuds
  3. Validation de praticabilité : Le nouvel algorithme peut traiter les arbres de décision à grande échelle qui peuvent apparaître dans les applications réelles

Travaux Connexes

Recherche sur l'Ensemble de Rashomon

  • Concepts fondamentaux : Breiman (2001) a d'abord introduit le concept d'ensemble de Rashomon
  • Développements récents : Travaux de Fisher et al., Semenova et al. sur l'importance des caractéristiques
  • Équivalence prédictive : McTavish et al. ont d'abord étudié systématiquement l'équivalence prédictive des arbres de décision

IA Explicable Basée sur la Logique

  • Explications formalisées : Travaux de Marques-Silva et al. sur AXp et CXp
  • Complexité computationnelle : Plusieurs recherches ont prouvé la complexité du calcul d'explications
  • Mesures d'interprétabilité : Application des valeurs de Shapley et Banzhaf en apprentissage automatique

Minimisation de Formules Booléennes

  • Méthodes classiques : Développement historique de l'algorithme de Quine-McCluskey
  • Théorie de la complexité : Établissement de la complexité Σₚ²-difficile
  • Limitations pratiques : La méthode QM est connue pour avoir une efficacité qui chute drastiquement lorsque le nombre de variables dépasse 8

Conclusions et Discussion

Conclusions Principales

  1. Contribution théorique : Preuve que la méthode QM rencontre effectivement une complexité exponentielle sur les arbres de décision
  2. Contribution algorithmique : Fourniture d'un algorithme alternatif en temps polynomial
  3. Valeur pratique : Le nouvel algorithme présente des avantages significatifs dans les applications réelles
  4. Connexions théoriques : Établissement de liens entre l'équivalence prédictive et plusieurs concepts d'IA explicable

Limitations

  1. Implémentation Python : Les expériences utilisant Python peuvent affecter l'évaluation des valeurs absolues de performance
  2. Constructions spéciales : Les expériences se concentrent principalement sur des arbres de décision spécialement construits
  3. Parallélisation : Le potentiel de parallélisation de l'algorithme d'équivalence prédictive n'a pas été validé sur des grappes à grande échelle
  4. Généralité : Nécessite une validation supplémentaire sur des ensembles de données réels

Directions Futures

  1. Algorithmes asymptotiquement optimaux : Recherche d'algorithmes théoriquement optimaux
  2. Autres types de modèles : Extension de la méthode à d'autres modèles interprétables
  3. Applications pratiques : Application dans l'optimisation réelle d'ensembles de Rashomon
  4. Implémentation parallèle : Développement d'implémentations parallélisées à grande échelle

Évaluation Approfondie

Avantages

  1. Rigueur théorique : Preuve mathématique complète et analyse de complexité
  2. Valeur pratique élevée : Résolution des problèmes de performance fondamentaux des méthodes existantes
  3. Forte innovativité : Première analyse systématique des problèmes de la méthode QM sur les arbres de décision
  4. Expériences suffisantes : Validation à la fois sur des constructions théoriques et sur des tests à échelle réelle
  5. Écriture claire : Structure d'article bien organisée, description technique claire

Insuffisances

  1. Portée expérimentale : Validation principalement sur des cas de test construits, manque de résultats sur des ensembles de données réels
  2. Langage d'implémentation : L'utilisation de Python peut ne pas être le meilleur choix, affectant la persuasion de la comparaison de performance
  3. Validation d'application : Manque de validation dans les tâches réelles d'optimisation d'ensembles de Rashomon
  4. Analyse des contraintes QM : Analyse insuffisante de la réalisabilité pratique des contraintes de correction de la méthode QM

Impact

  1. Valeur académique : Fourniture de nouveaux outils théoriques pour la recherche sur les arbres de décision
  2. Signification pratique : Peut modifier les méthodes pratiques d'analyse des ensembles de Rashomon
  3. Reproductibilité : Description claire des algorithmes, facile à reproduire
  4. Extensibilité : La méthode peut s'appliquer à d'autres modèles interprétables

Scénarios d'Application

  1. Applications à haut risque : Domaines médicaux, financiers et autres nécessitant une IA explicable
  2. Sélection de modèles : Scénarios nécessitant de choisir parmi plusieurs modèles équivalents
  3. Analyse d'importance des caractéristiques : Applications nécessitant une évaluation précise de l'importance des caractéristiques
  4. Applications industrielles : Traitement d'arbres de décision complexes à grande échelle

Références

Cet article cite un large éventail de travaux connexes, incluant principalement :

  1. Ensemble de Rashomon : Breiman (2001), Xin et al. (2022), Fisher et al. (2019)
  2. IA Explicable Basée sur la Logique : Marques-Silva (2022), Darwiche (2023), Ignatiev et al. (2019)
  3. Minimisation de Fonctions Booléennes : Quine (1952, 1955), McCluskey (1956), Umans (1998)
  4. Optimisation d'Arbres de Décision : Bertsimas & Dunn (2017), Hu et al. (2019), Demirovic et al. (2022)

Évaluation Globale : Ceci est un article de haute qualité combinant théorie et pratique, qui non seulement révèle les défauts fondamentaux des méthodes existantes, mais fournit également des solutions pratiques. L'analyse théorique de l'article est rigoureuse, la validation expérimentale est suffisante, et il apporte des contributions importantes aux domaines des arbres de décision et de l'IA explicable.