2025-11-25T10:28:17.626083

Smoothed analysis for graph isomorphism

Anastos, Kwan, Moore

There is no known polynomial-time algorithm for graph isomorphism testing, but elementary combinatorial "refinement" algorithms seem to be very efficient in practice. Some philosophical justification is provided by a classical theorem of Babai, ErdÅs and Selkow: an extremely simple polynomial-time combinatorial algorithm (variously known as "naÃ¯ve refinement", "naÃ¯ve vertex classification", "colour refinement" or the "1-dimensional Weisfeiler-Leman algorithm") yields a so-called canonical labelling scheme for "almost all graphs". More precisely, for a typical outcome of a random graph $G(n,1/2)$, this simple combinatorial algorithm assigns labels to vertices in a way that easily permits isomorphism-testing against any other graph. We improve the Babai-ErdÅs-Selkow theorem in two directions. First, we consider randomly perturbed graphs, in accordance with the smoothed analysis philosophy of Spielman and Teng: for any graph $G$, naÃ¯ve refinement becomes effective after a tiny random perturbation to $G$ (specifically, the addition and removal of $O(n\log n)$ random edges). Actually, with a twist on naÃ¯ve refinement, we show that $O(n)$ random additions and removals suffice. These results significantly improve on previous work of Gaudio-RÃ¡cz-Sridhar, and are in certain senses best-possible. Second, we complete a long line of research on canonical labelling of random graphs: for any $p$ (possibly depending on $n$), we prove that a random graph $G(n,p)$ can typically be canonically labelled in polynomial time. This is most interesting in the extremely sparse regime where $p$ has order of magnitude $c/n$; denser regimes were previously handled by BollobÃ¡s, Czajka-Pandurangan, and Linial-Mosheiff. Our proof also provides a description of the automorphism group of a typical outcome of $G(n,p_n)$ (slightly correcting a prediction of Linial-Mosheiff).

academic

Analyse lissée pour l'isomorphisme de graphes

Informations de base

ID de l'article: 2410.06095
Titre: Smoothed analysis for graph isomorphism
Auteurs: Michael Anastos, Matthew Kwan, Benjamin Moore
Classification: math.CO cs.CC cs.DS
Date de publication: Octobre 2024
Lien de l'article: https://arxiv.org/abs/2410.06095v3

Résumé

Le problème du test d'isomorphisme de graphes ne dispose d'aucun algorithme connu en temps polynomial, mais les algorithmes combinatoires fondamentaux de « raffinement » s'avèrent très efficaces en pratique. Le théorème classique de Babai, Erdős et Selkow fournit une explication philosophique à ce phénomène : un algorithme combinatoire polynomial extrêmement simple (appelé « raffinement naïf », « classification naïve des sommets », « raffinement des couleurs » ou « algorithme de Weisfeiler-Leman unidimensionnel ») fournit un schéma d'étiquetage canonique pour « presque tous les graphes ».

Cet article améliore le théorème de Babai-Erdős-Selkow dans deux directions : premièrement, en considérant les graphes perturbés aléatoirement selon l'idée d'analyse lissée de Spielman et Teng ; deuxièmement, en complétant une ligne de recherche de longue date concernant l'étiquetage canonique des graphes aléatoires.

Contexte et motivation de la recherche

Contexte du problème

Importance du problème d'isomorphisme de graphes : Le test d'isomorphisme de graphes est un problème central de la théorie de la complexité computationnelle, occupant une position particulière entre P et NP-complet
Écart entre théorie et pratique : Bien que le pire cas nécessite un temps exponentiel, l'algorithme de raffinement des couleurs s'avère excellent en pratique
Limitations du théorème de Babai-Erdős-Selkow : Ce théorème classique s'applique uniquement aux graphes aléatoires G(n,1/2) et fonctionne mal pour les graphes structurés

Motivation de la recherche

Application de l'analyse lissée : Appliquer le cadre d'analyse lissée de Spielman-Teng au problème d'isomorphisme de graphes
Extension du domaine d'application : Prouver que de légères perturbations aléatoires suffisent pour rendre l'algorithme de raffinement des couleurs efficace pour tout graphe
Perfectionnement du système théorique : Fournir une théorie complète d'étiquetage canonique pour les graphes aléatoires de toute densité

Contributions principales

Résultats d'analyse lissée : Preuve que le raffinement des couleurs réussit presque toujours après O(n log n) perturbations aléatoires d'arêtes sur tout graphe G₀
Limites de perturbation améliorées : Réduction du nombre de perturbations aléatoires nécessaires à O(n) arêtes grâce à un algorithme modifié
Théorie complète pour les graphes aléatoires clairsemés : Schéma d'étiquetage canonique en temps polynomial pour les graphes aléatoires G(n,p) de densité arbitraire
Caractérisation du groupe d'automorphisme : Description de la structure du groupe d'automorphisme des graphes aléatoires typiques, corrigeant les prédictions de Linial-Mosheiff

Explication détaillée des méthodes

Définition de la tâche

Étant donné deux graphes G₁ et G₂ à n sommets, le problème d'isomorphisme de graphes demande de déterminer s'il existe une bijection entre les ensembles de sommets préservant les relations d'adjacence. L'étiquetage canonique est une méthode d'assignation d'une forme standard à chaque graphe, de sorte que les graphes isomorphes possèdent le même étiquetage.

Algorithme central : Raffinement des couleurs

Cadre fondamental

L'algorithme de raffinement des couleurs est un processus itératif :

Initialisation : Tous les sommets reçoivent la même couleur
Étape de raffinement : Mise à jour de la couleur de chaque sommet selon la distribution des couleurs de ses voisins
Stabilisation : Répétition jusqu'à ce que l'assignation des couleurs ne change plus

Description mathématique

Pour un graphe G et une coloration c : V(G) → Ω, l'opération de raffinement est définie comme :

R_G c(v) = (c(v), (d_ω(v))_{ω∈Ω})

où d_ω(v) est le nombre de voisins de couleur ω du sommet v.

Vues et couvertures universelles

L'efficacité de l'algorithme est analysée via le concept de « vue » :

La vue T_G(v) encode tous les chemins possibles commençant au sommet v
Deux sommets ont la même couleur si et seulement si leurs vues sont isomorphes

Points d'innovation technique

1. Techniques d'expansion et de non-concentration

Propriétés d'expansion : Utilisation des propriétés d'expansion fortes des graphes aléatoires pour prouver que les petits ensembles de sommets croissent rapidement
Inégalités de non-concentration : Application d'inégalités de type Erdős-Littlewood-Offord pour contrôler les fluctuations aléatoires

2. Analyse de la structure centrale

k-cœur : Le k-cœur d'un graphe est le sous-graphe maximal de degré minimum au moins k
Propriétés spéciales du 2-cœur : Dans le 2-cœur, les sommets de degré au moins 3 peuvent généralement être distingués par le raffinement des couleurs

3. Technique de saupoudrage (Sprinkling)

Décomposition de la perturbation aléatoire en plusieurs perturbations indépendantes et clairsemées :

Chaque tour de perturbation confère une couleur unique aux nouveaux sommets
Utilisation de la monotonie pour améliorer progressivement les propriétés du graphe

4. Graphe de disparité (Disparity Graph)

Définition du graphe de disparité D(G,c) pour analyser l'efficacité du raffinement des couleurs :

Capture l'inadéquation entre la structure du graphe et les classes de couleurs
Les petites composantes connexes correspondent à un étiquetage canonique efficace

Théorèmes principaux

Théorème 1.2 (Analyse lissée - version fondamentale)

Pour une constante ε > 0 et p ≥ (1+ε)log n/n, tout graphe G₀ et graphe aléatoire G_rand ~ G(n,p), l'algorithme de raffinement des couleurs distingue presque toujours tous les sommets de G₀△G_rand.

Théorème 1.3 (Analyse lissée améliorée)

Il existe une classe de graphes H et un algorithme d'étiquetage canonique en temps polynomial tels que pour p ≥ 100/n, tout graphe G₀ et G_rand ~ G(n,p), presque toujours G₀△G_rand ∈ H.

Théorème 1.4 (Graphes aléatoires clairsemés)

Pour toute séquence (p_n), le graphe aléatoire G_n ~ G(n,p_n) peut presque toujours être étiqueté canoniquement en temps polynomial.

Techniques de preuve

Lemme clé 4.1

C'est le résultat technique central, prouvant que dans un graphe perturbé aléatoirement de manière appropriée, lorsque S^{≤i}({u,v}) est suffisamment grand, les sommets u et v sont presque toujours distingués par le raffinement des couleurs.

Stratégie de preuve

Processus d'exploration : Révélation progressive des arêtes aléatoires, étude de l'évolution de l'ensemble des différences de vues
Lemme d'expansion : Preuve que les petits ensembles de différences croissent exponentiellement
Analyse de non-concentration : Utilisation des propriétés de non-concentration des variables aléatoires indépendantes

Algorithme de Weisfeiler-Leman bidimensionnel

Pour une analyse plus fine, introduction de la version bidimensionnelle :

Coloration des paires de sommets plutôt que des sommets individuels
Capacité à détecter les informations de distance
Pouvoir de distinction plus fort

Configuration expérimentale

Analyse théorique prédominante

Cet article procède principalement par analyse théorique, prouvant l'efficacité de l'algorithme par des méthodes probabilistes :

Modèle probabiliste : Utilisation du modèle de graphe aléatoire Erdős-Rényi G(n,p)
Analyse asymptotique : Étude du comportement lorsque n → ∞
Événements haute probabilité : Preuve que les propriétés requises se produisent avec probabilité 1-o(1)

Analyse de complexité

Raffinement des couleurs : Temps O((n+m)log n)
Algorithme bidimensionnel : Temps O(n³log n)
Algorithme global : Temps polynomial

Résultats principaux

Résultats d'analyse lissée

Seuil de perturbation : Preuve que p ≥ (1+ε)log n/n est le seuil permettant le succès du raffinement des couleurs
Optimalité : Ce seuil est optimal en un certain sens
Algorithme amélioré : Réduction du seuil à p ≥ 100/n grâce à l'algorithme de Weisfeiler-Leman bidimensionnel

Résultats pour les graphes aléatoires clairsemés

Caractérisation complète : Schéma d'étiquetage canonique fourni pour toute densité p
Phénomène de transition de phase : Découverte d'une transition de phase critique près de p ≈ 1/n
Groupe d'automorphisme : Description complète de la structure du groupe d'automorphisme des graphes aléatoires clairsemés

Contributions techniques

Nouveaux outils d'analyse : Développement de nouvelles techniques pour analyser les graphes perturbés aléatoirement
Cadre unifié : Unification des résultats pour différents intervalles de densité dans un seul cadre
Constantes précises : Fourniture de limites de constantes précises dans plusieurs résultats

Travaux connexes

Développement historique

Résultats classiques : Babai-Erdős-Selkow (1980) établit la théorie fondamentale
Cas dense : Bollobás et al. traitent les graphes aléatoires relativement denses
Cas clairsemé : Linial-Mosheiff traite certains cas clairsemés

Contexte de l'analyse lissée

Cadre de Spielman-Teng : Introduction de l'analyse lissée aux problèmes discrets
Applications aux algorithmes de graphes : Applications antérieures aux problèmes de coloration, d'appariement, etc.
Contribution de cet article : Application systématique pour la première fois de l'analyse lissée à l'isomorphisme de graphes

Complexité algorithmique

Percée de Babai : Algorithme en temps quasi-polynomial
Algorithmes pratiques : Paradigme d'individualisation-raffinement
Travail théorique : Explication théorique de l'efficacité des algorithmes pratiques

Conclusion et discussion

Conclusions principales

Explication théorique : Fourniture d'une explication théorique de l'efficacité pratique de l'algorithme de raffinement des couleurs
Puissance de la perturbation : Preuve de l'effet considérable de légères perturbations aléatoires
Tableau complet : Fourniture d'un tableau théorique complet pour le problème d'isomorphisme de graphes aléatoires

Limitations

Exigences de perturbation : Nécessité d'une certaine quantité de perturbation aléatoire
Optimisation des constantes : Certaines constantes pourraient ne pas être optimales
Application pratique : La conversion des résultats théoriques en algorithmes pratiques nécessite des travaux supplémentaires

Directions futures

Modèles de perturbation : Considération d'autres types de perturbations aléatoires
Amélioration algorithmique : Développement d'algorithmes pratiques plus efficaces
Applications généralisées : Application des techniques à d'autres problèmes d'algorithmes de graphes

Évaluation approfondie

Avantages

Profondeur théorique : Fourniture d'intuitions théoriques profondes expliquant un phénomène pratique important
Innovation technique : Développement de plusieurs nouvelles techniques d'analyse, en particulier la méthode d'analyse des vues et le saupoudrage
Complétude : Fourniture d'un tableau théorique relativement complet pour un problème classique
Précision : Fourniture de seuils et constantes précis dans plusieurs résultats

Contributions techniques

Méthodologie : Application réussie de l'analyse lissée aux problèmes de structures discrètes
Outils d'analyse : Utilisation systématique de concepts tels que le graphe de disparité, les vues et l'algorithme de Weisfeiler-Leman bidimensionnel
Techniques probabilistes : Combinaison ingénieuse des propriétés d'expansion et des inégalités de non-concentration

Insuffisances

Complexité : Les techniques de preuve sont relativement complexes, la lisibilité pourrait être améliorée
Applicabilité pratique : La conversion des résultats théoriques en algorithmes pratiques n'est pas suffisamment directe
Optimisation des constantes : Certaines constantes techniques pourraient présenter des marges d'amélioration

Évaluation de l'impact

Impact académique : Contributions importantes à la théorie de l'isomorphisme de graphes et des graphes aléatoires
Impact méthodologique : Démonstration de l'application de l'analyse lissée en mathématiques discrètes
Potentiel pratique : Fourniture de conseils théoriques pour le développement d'algorithmes d'isomorphisme de graphes améliorés

Scénarios d'application

Recherche théorique : Recherche en complexité de l'isomorphisme de graphes et théorie des graphes aléatoires
Conception algorithmique : Inspiration pour la conception de nouveaux algorithmes d'isomorphisme de graphes
Problèmes connexes : Les techniques pourraient s'appliquer à d'autres problèmes d'algorithmes de graphes

Détails techniques supplémentaires

Inégalités clés

L'article utilise plusieurs inégalités probabilistes importantes :

Limites de Chernoff pour l'analyse de concentration
Inégalités de non-concentration de type Erdős-Littlewood-Offord
Estimations précises des probabilités modales

Structures de théorie des graphes

Propriétés et calcul des k-cœurs
Chemins nus et structures centrales
Processus d'évolution des composantes connexes

Complexité algorithmique

Analyse détaillée de la complexité temporelle de chaque composante algorithmique, prouvant la nature polynomiale du temps global.

Cet article apporte des contributions importantes à la recherche théorique sur le problème d'isomorphisme de graphes, en particulier dans l'explication de l'efficacité des algorithmes pratiques et l'amélioration de la théorie des graphes aléatoires. Bien que les techniques soient relativement complexes, il fournit une nouvelle perspective et des intuitions profondes sur ce problème classique.