2025-11-12T13:34:14.831387

Efficient & Correct Predictive Equivalence for Decision Trees

Marques-Silva, Ignatiev

The Rashomon set of decision trees (DTs) finds importance uses. Recent work showed that DTs computing the same classification function, i.e. predictive equivalent DTs, can represent a significant fraction of the Rashomon set. Such redundancy is undesirable. For example, feature importance based on the Rashomon set becomes inaccurate due the existence of predictive equivalent DTs, i.e. DTs with the same prediction for every possible input. In recent work, McTavish et al. proposed solutions for several computational problems related with DTs, including that of deciding predictive equivalent DTs. The approach of McTavish et al. consists of applying the well-known method of Quine-McCluskey (QM) for obtaining minimum-size DNF (disjunctive normal form) representations of DTs, which are then used for comparing DTs for predictive equivalence. Furthermore, the minimum-size DNF representation was also applied to computing explanations for the predictions made by DTs, and to finding predictions in the presence of missing data. However, the problem of formula minimization is hard for the second level of the polynomial hierarchy, and the QM method may exhibit worst-case exponential running time and space. This paper first demonstrates that there exist decision trees that trigger the worst-case exponential running time and space of the QM method. Second, the paper shows that the QM method may incorrectly decide predictive equivalence, if two key constraints are not respected, and one may be difficult to formally guarantee. Third, the paper shows that any of the problems to which the smallest DNF representation has been applied to can be solved in polynomial time, in the size of the DT. The experiments confirm that, for DTs for which the worst-case of the QM method is triggered, the algorithms proposed in this paper are orders of magnitude faster than the ones proposed by McTavish et al.

academic

Équivalence Prédictive Efficace et Correcte pour les Arbres de Décision

Informations Fondamentales

ID de l'article : 2509.17774
Titre : Efficient & Correct Predictive Equivalence for Decision Trees
Auteurs : João Marques-Silva (ICREA & University of Lleida), Alexey Ignatiev (Monash University)
Classification : cs.AI cs.LG cs.LO
Date de publication/Conférence : Journal of Machine Learning Research 23 (2025) 1-35
Lien de l'article : https://arxiv.org/abs/2509.17774

Résumé

L'ensemble de Rashomon des arbres de décision présente une valeur applicative importante. Des recherches récentes montrent que le calcul d'arbres de décision produisant la même fonction de classification (c'est-à-dire des arbres de décision prédictivement équivalents) peut constituer une part considérable de l'ensemble de Rashomon. Cette redondance est indésirable, par exemple l'importance des caractéristiques basée sur l'ensemble de Rashomon devient inexacte en raison de l'existence d'arbres de décision prédictivement équivalents. McTavish et al. ont récemment proposé une solution aux problèmes de calcul liés aux arbres de décision, y compris la détermination des arbres de décision prédictivement équivalents. Leur méthode utilise la célèbre méthode de Quine-McCluskey (QM) pour obtenir une représentation DNF minimale de l'arbre de décision, puis l'utilise pour comparer l'équivalence prédictive des arbres de décision. Cependant, le problème de minimisation de formule est difficile pour la deuxième couche de la hiérarchie polynomiale, et la méthode QM peut présenter une complexité de temps et d'espace exponentielle dans le pire cas. Cet article prouve d'abord qu'il existe des arbres de décision qui déclenchent la complexité exponentielle du pire cas de la méthode QM, montre ensuite que la méthode QM peut mal juger l'équivalence prédictive si deux contraintes clés ne sont pas satisfaites, et prouve enfin que tous les problèmes appliquant la représentation DNF minimale peuvent être résolus en temps polynomial par rapport à la taille de l'arbre de décision.

Contexte de Recherche et Motivation

Définition du Problème

Le problème fondamental abordé dans cet article est l'efficacité et la correction du jugement d'équivalence prédictive des arbres de décision. Les arbres de décision prédictivement équivalents sont des arbres de décision distincts qui produisent les mêmes résultats de prédiction pour toute entrée.

Importance du Problème

Optimisation de l'ensemble de Rashomon : En apprentissage automatique, l'ensemble de Rashomon contient plusieurs modèles aux performances similaires. Les arbres de décision prédictivement équivalents créent une redondance dans cet ensemble, affectant la précision de l'évaluation de l'importance des caractéristiques.
Besoins d'interprétabilité : Les arbres de décision sont largement reconnus comme des modèles interprétables, mais même les arbres optimaux nécessitent une explication formalisée, particulièrement dans les applications à haut risque.
Efficacité computationnelle : Les méthodes existantes font face à des goulots d'étranglement computationnels graves lors du traitement d'arbres de décision à grande échelle.

Limitations des Méthodes Existantes

La méthode proposée par McTavish et al. basée sur l'algorithme de Quine-McCluskey (QM) présente les problèmes suivants :

Complexité computationnelle : La méthode QM résout un problème Σₚ²-difficile, nécessitant un temps et un espace exponentiels dans le pire cas
Problèmes de correction : Peut produire des résultats incorrects lorsque certaines contraintes spécifiques ne sont pas satisfaites
Viabilité pratique : La méthode QM est connue pour avoir une très mauvaise scalabilité pour les problèmes avec des dizaines de variables

Contributions Principales

Analyse théorique : Preuve de l'existence d'arbres de décision déclenchant la complexité exponentielle du pire cas de la méthode QM
Analyse de correction : Révélation des problèmes potentiels de correction de la méthode QM dans le jugement d'équivalence prédictive
Algorithme efficace : Proposition d'un algorithme en temps polynomial résolvant les problèmes de complétude, concision et jugement d'équivalence prédictive
Validation expérimentale : Sur les arbres de décision déclenchant le pire cas QM, le nouvel algorithme est plusieurs ordres de grandeur plus rapide que les méthodes existantes
Connexions théoriques : Établissement de liens théoriques entre l'équivalence prédictive et les explications logiques, les mesures d'importance

Détails de la Méthode

Définition de la Tâche

Étant donné deux arbres de décision T₁ et T₂, déterminer s'ils sont prédictivement équivalents, c'est-à-dire :

∀(x ∈ F). (κₜ₁(x) = κₜ₂(x))

où F est l'espace des caractéristiques et κ est la fonction de classification.

Cadre Technique Principal

1. Méthode d'Explication Faiblement Inductive (WAXp)

L'article propose un algorithme en temps polynomial basé sur WAXp :

Algorithme 1 : Vérification de Cohérence de Chemin

def ConsistentPath(A, P, T):
    # Vérifier la cohérence d'une affectation partielle A avec le chemin P de l'arbre
    for each feature i:
        combine literals from A and P for feature i
        if inconsistent: return False
    return True

Algorithme 2 : Jugement WAXp

def IsWAXp(A, c, T):
    # Déterminer si une affectation partielle A est un WAXp pour la classe c
    for each path P in T:
        if Class(P) != c and ConsistentPath(A, P, T):
            return False  # A est cohérente avec un chemin d'une autre classe
    return True

2. Algorithme de Jugement d'Équivalence Prédictive

Algorithme 5 : Jugement d'Équivalence Prédictive

def PredictivelyEquivalent(T1, T2):
    for P1 in Paths(T1):
        c1 = Class(P1)
        A1 = Literals(P1)  # Créer une affectation partielle
        for P2 in Paths(T2):
            c2 = Class(P2)
            if c1 != c2 and ConsistentPath(A1, P2, T2):
                return False  # Preuve de non-équivalence trouvée
    return True  # Aucune preuve de non-équivalence, donc équivalent

Points d'Innovation Technique

Éviter la complexité exponentielle : Opération directe sur la structure de l'arbre de décision, évitant la génération de représentations BCF potentiellement exponentielles
Garantie de temps polynomial : Tous les algorithmes ont une complexité temporelle polynomiale par rapport à la taille de l'arbre de décision
Correction formalisée : Preuve mathématique rigoureuse garantissant la correction de l'algorithme
Parallélisabilité : L'algorithme d'équivalence prédictive peut être parallélisé pour une efficacité accrue

Configuration Expérimentale

Cas de Test Construits

L'article utilise des constructions d'arbres de décision spéciaux basées sur le théorème 1 :

Paramètre r : Contrôle la complexité de l'arbre
Nombre de nœuds : 6r + 3 nœuds
Nombre de caractéristiques : 2r + 1 caractéristiques
Taille BCF : Pour la classe 1, limite inférieure de 2^r termes premiers implicants

Métriques d'Évaluation

Temps d'exécution : Temps d'exécution de l'algorithme (secondes)
Taille BCF : Nombre de termes premiers implicants dans la forme standard de Blake
Scalabilité : Capacité à traiter des arbres de décision de différentes tailles

Méthodes de Comparaison

Implémentation QM de SymPy : Méthode de référence utilisée par McTavish et al.
Génération BCF indépendante : Étape de génération de termes premiers implicants QM standard implémentée par les auteurs

Détails d'Implémentation

Plateforme : Processeur Macbook M3 Pro
Langage de programmation : Python
Limite de temps : Limite de 150000 secondes pour la méthode QM

Résultats Expérimentaux

Résultats Principaux

Vérification de la Complexité Exponentielle de la Méthode QM

r	Temps SymPy(s)	\|BCF₀(T)\|	\|BCF₁(T)\|	Temps BCF(s)
3	0.13	4	22	0.01
4	0.57	5	46	0.07
5	39.60	6	94	0.84
6	2789.45	7	190	11.28
7	>150000.00	8	382	161.25

Performance de Scalabilité du Nouvel Algorithme

r	Nœuds AD	Caractéristiques	\|BCF₁(T)\|	Un AXp	isWAXp?	PE?
200	1203	401	2²⁰⁰	1.71s	0.005s	3.7s
500	3003	1001	2⁵⁰⁰	26.98s	0.032s	57.1s
1000	6003	2001	2¹⁰⁰⁰	224.62s	0.126s	469.0s

Découvertes Clés

Confirmation de la croissance exponentielle : La taille de BCF₁(T) croît exponentiellement avec r, validant l'analyse théorique
Écart de performance massif : Pour r=200, le nouvel algorithme traite un arbre de décision de 1203 nœuds en quelques secondes, tandis que la méthode QM dépasse le délai d'attente avec 57 nœuds
Validation de praticabilité : Le nouvel algorithme peut traiter les arbres de décision à grande échelle qui peuvent apparaître dans les applications réelles

Travaux Connexes

Recherche sur l'Ensemble de Rashomon

Concepts fondamentaux : Breiman (2001) a d'abord introduit le concept d'ensemble de Rashomon
Développements récents : Travaux de Fisher et al., Semenova et al. sur l'importance des caractéristiques
Équivalence prédictive : McTavish et al. ont d'abord étudié systématiquement l'équivalence prédictive des arbres de décision

IA Explicable Basée sur la Logique

Explications formalisées : Travaux de Marques-Silva et al. sur AXp et CXp
Complexité computationnelle : Plusieurs recherches ont prouvé la complexité du calcul d'explications
Mesures d'interprétabilité : Application des valeurs de Shapley et Banzhaf en apprentissage automatique

Minimisation de Formules Booléennes

Méthodes classiques : Développement historique de l'algorithme de Quine-McCluskey
Théorie de la complexité : Établissement de la complexité Σₚ²-difficile
Limitations pratiques : La méthode QM est connue pour avoir une efficacité qui chute drastiquement lorsque le nombre de variables dépasse 8

Conclusions et Discussion

Conclusions Principales

Contribution théorique : Preuve que la méthode QM rencontre effectivement une complexité exponentielle sur les arbres de décision
Contribution algorithmique : Fourniture d'un algorithme alternatif en temps polynomial
Valeur pratique : Le nouvel algorithme présente des avantages significatifs dans les applications réelles
Connexions théoriques : Établissement de liens entre l'équivalence prédictive et plusieurs concepts d'IA explicable

Limitations

Implémentation Python : Les expériences utilisant Python peuvent affecter l'évaluation des valeurs absolues de performance
Constructions spéciales : Les expériences se concentrent principalement sur des arbres de décision spécialement construits
Parallélisation : Le potentiel de parallélisation de l'algorithme d'équivalence prédictive n'a pas été validé sur des grappes à grande échelle
Généralité : Nécessite une validation supplémentaire sur des ensembles de données réels

Directions Futures

Algorithmes asymptotiquement optimaux : Recherche d'algorithmes théoriquement optimaux
Autres types de modèles : Extension de la méthode à d'autres modèles interprétables
Applications pratiques : Application dans l'optimisation réelle d'ensembles de Rashomon
Implémentation parallèle : Développement d'implémentations parallélisées à grande échelle

Évaluation Approfondie

Avantages

Rigueur théorique : Preuve mathématique complète et analyse de complexité
Valeur pratique élevée : Résolution des problèmes de performance fondamentaux des méthodes existantes
Forte innovativité : Première analyse systématique des problèmes de la méthode QM sur les arbres de décision
Expériences suffisantes : Validation à la fois sur des constructions théoriques et sur des tests à échelle réelle
Écriture claire : Structure d'article bien organisée, description technique claire

Insuffisances

Portée expérimentale : Validation principalement sur des cas de test construits, manque de résultats sur des ensembles de données réels
Langage d'implémentation : L'utilisation de Python peut ne pas être le meilleur choix, affectant la persuasion de la comparaison de performance
Validation d'application : Manque de validation dans les tâches réelles d'optimisation d'ensembles de Rashomon
Analyse des contraintes QM : Analyse insuffisante de la réalisabilité pratique des contraintes de correction de la méthode QM

Impact

Valeur académique : Fourniture de nouveaux outils théoriques pour la recherche sur les arbres de décision
Signification pratique : Peut modifier les méthodes pratiques d'analyse des ensembles de Rashomon
Reproductibilité : Description claire des algorithmes, facile à reproduire
Extensibilité : La méthode peut s'appliquer à d'autres modèles interprétables

Scénarios d'Application

Applications à haut risque : Domaines médicaux, financiers et autres nécessitant une IA explicable
Sélection de modèles : Scénarios nécessitant de choisir parmi plusieurs modèles équivalents
Analyse d'importance des caractéristiques : Applications nécessitant une évaluation précise de l'importance des caractéristiques
Applications industrielles : Traitement d'arbres de décision complexes à grande échelle

Références

Cet article cite un large éventail de travaux connexes, incluant principalement :

Ensemble de Rashomon : Breiman (2001), Xin et al. (2022), Fisher et al. (2019)
IA Explicable Basée sur la Logique : Marques-Silva (2022), Darwiche (2023), Ignatiev et al. (2019)
Minimisation de Fonctions Booléennes : Quine (1952, 1955), McCluskey (1956), Umans (1998)
Optimisation d'Arbres de Décision : Bertsimas & Dunn (2017), Hu et al. (2019), Demirovic et al. (2022)

Évaluation Globale : Ceci est un article de haute qualité combinant théorie et pratique, qui non seulement révèle les défauts fondamentaux des méthodes existantes, mais fournit également des solutions pratiques. L'analyse théorique de l'article est rigoureuse, la validation expérimentale est suffisante, et il apporte des contributions importantes aux domaines des arbres de décision et de l'IA explicable.