In this paper, we consider the nonlinear constrained optimization problem (NCP) with constraint set $\{x \in \mathcal{X}: c(x) = 0\}$, where $\mathcal{X}$ is a closed convex subset of $\mathbb{R}^n$. Building upon the forward-backward envelope framework for optimization over $\mathcal{X}$, we propose a forward-backward semi-envelope (FBSE) approach for solving (NCP). In the proposed semi-envelope approach, we eliminate the constraint $x \in \mathcal{X}$ through a specifically designed envelope scheme while preserving the constraint $x \in \mathcal{M} := \{x \in \mathbb{R}^n: c(x) = 0\}$. We establish that the forward-backward semi-envelope for (NCP) is well-defined and locally Lipschitz smooth over a neighborhood of $\mathcal{M}$. Furthermore, we prove that (NCP) and its corresponding forward-backward semi-envelope have the same first-order stationary points within a neighborhood of $\mathcal{X} \cap \mathcal{M}$. Consequently, our proposed forward-backward semi-envelope approach enables direct application of optimization methods over $\mathcal{M}$ while inheriting their convergence properties for (NCP). Additionally, we develop an inexact projected gradient descent method for minimizing the forward-backward semi-envelope over $\mathcal{M}$ and establish its global convergence. Preliminary numerical experiments demonstrate the practical efficiency and potential of our proposed approach.
- ID du papier: 2510.22223
- Titre: Partial Envelope for Optimization Problem with Nonconvex Constraints
- Auteurs: Xiaoyin Hu, Xin Liu, Kim-Chuan Toh, Nachuan Xiao
- Classification: math.OC (Optimisation Mathématique et Contrôle)
- Date de soumission: 25 octobre 2025
- Lien du papier: https://arxiv.org/abs/2510.22223v1
Cet article étudie les problèmes d'optimisation non-linéaire avec contraintes (NCP) de la forme {x∈X:c(x)=0}, où X est un sous-ensemble convexe fermé de Rn. En s'appuyant sur le cadre d'enveloppe avant-arrière sur X, les auteurs proposent la méthode d'enveloppe partielle avant-arrière (FBSE). Cette méthode élimine la contrainte x∈X par un schéma d'enveloppe spécialement conçu, tout en préservant la contrainte x∈M:={x∈Rn:c(x)=0}. L'article démontre que FBSE est bien définie et localement Lipschitz-lisse au voisinage de M, et que NCP et FBSE possèdent les mêmes points stationnaires du premier ordre au voisinage de X∩M. De plus, les auteurs développent une méthode de descente de gradient projeté inexacte et établissent sa convergence globale et sa complexité itérative O(ε−2).
Cet article étudie les problèmes d'optimisation avec contraintes de la forme:
minx∈Rnf(x)+IX(x)s.c.x∈M:={x∈Rn:c(x)=0}
où IX(x) est la fonction indicatrice de l'ensemble X, et X est un sous-ensemble convexe compact possédant une projection facile à calculer. Ce problème est équivalent à minimiser f(x) sur {x∈X:c(x)=0}.
Cette classe de problèmes d'optimisation englobe plusieurs modèles d'optimisation importants:
- Optimisation avec contraintes d'égalité et d'inégalité
- Problèmes de programmation conique (comme la programmation semi-définie)
- Problèmes d'optimisation sur variétés
Les domaines d'application sont vastes, notamment:
- Les tâches d'apprentissage automatique
- Le traitement du signal
- La conception mécanique, etc.
Restrictions des méthodes d'enveloppe traditionnelles:
- L'enveloppe avant-arrière (Forward-Backward Envelope) et l'enveloppe de Moreau dépendent de la convexité de l'ensemble de contraintes
- Lorsque NCP est considéré comme un problème sans contrainte avec fonction indicatrice IX∩M, la non-convexité de M∩X rend la fonction d'enveloppe non-lisse
- La projection sur X∩M est coûteuse en calcul, même si ΠM et ΠX sont faciles à calculer
Limitations des méthodes de dissolution de contraintes:
Les méthodes récemment proposées (constraint dissolving approach) découplent les contraintes via une fonction de pénalité exacte:
minx∈Xhcdf(x):=f(A(x))+2β∥c(x)∥2
mais nécessitent le choix d'un paramètre de pénalité β, ce qui est difficile en pratique.
Les auteurs posent la question centrale:
Est-il possible de développer une méthode d'enveloppe pour les problèmes d'optimisation avec contraintes de la forme NCP sans introduire aucun paramètre de pénalité?
- Proposition de la méthode d'enveloppe partielle avant-arrière (FBSE): Un nouveau schéma d'enveloppe qui élimine uniquement la contrainte convexe x∈X, préserve la contrainte d'égalité non-convexe c(x)=0, et n'introduit aucun paramètre de pénalité
- Établissement de l'équivalence théorique: Preuve que NCP et FBSE possèdent les mêmes points stationnaires du premier ordre au voisinage de X∩M (pour des paramètres d'enveloppe suffisamment petits μ)
- Preuve de bonnes propriétés de lissité: Démonstration que FBSE est bien définie au voisinage de M, continûment différentiable, et que le gradient est localement Lipschitz-continu
- Développement d'un algorithme efficace: Proposition d'une méthode de descente de gradient projeté inexacte qui évite le calcul du terme Hessien H(x) dans le gradient complet, avec preuve de:
- Convergence globale
- Complexité itérative O(ε−2)
- Vérification numérique: Les expériences sur les problèmes d'optimisation avec contraintes de cône semi-défini positif montrent que la méthode surpasse les solveurs existants en précision et efficacité
Problème original (NCP):
minx∈Rnf(x)+IX(x)s.c.c(x)=0
Hypothèses clés (Hypothèse 1.1):
- f:Rn→R est deux fois différentiable sur Rn
- c:Rn→Rp est deux fois différentiable, avec dérivée seconde localement Lipschitz-continue
- Condition de non-dégénérescence des contraintes: pour tout x∈K:=X∩M,
∇c(x)⊤lin(TX(x))=Rp
Définition d'une application Q:Rn→S+n×n satisfaisant:
- Q(x) est localement Lipschitz-lisse
- Pour tout x∈X, null(Q(x))=range(NX(x))
Application de dissolution de contraintes:
A(x)=x−Q(x)∇c(x)(∇c(x)⊤Q(x)∇c(x)+τ(x)Ip)−1c(x)
où τ(x):=Lτ(∥c(x)∥2+dist(x,X)2), avec Lτ>0 paramètre prédéfini.
Problème FBSE:
minx∈Rnψμ(x)s.c.x∈M
où la fonction d'enveloppe partielle est définie par:
ψμ(x):=minw∈Xf(x)+⟨J(x)∇f(x),w−x⟩+2μ1∥w−x∥2
Application clé:
J(x):=In−∇c(x)(∇c(x)⊤Q(x)∇c(x)+τ(x)Ip)−1∇c(x)⊤Q(x)
Solution optimale:
Tμ(x):=argminw∈Xf(x)+⟨J(x)∇f(x),w−x⟩+2μ1∥w−x∥2=ΠX(x−μJ(x)∇f(x))
Selon le Lemme 3.7, le gradient de ψμ est:
∇ψμ(x)=μ1(In−μH(x))(x−Tμ(x))+(In−J(x))∇f(x)
où H(x)=J(x)∇2f(x)+∇J(x)[∇f(x)].
Innovation clé: Contrairement aux méthodes d'enveloppe traditionnelles qui traitent l'ensemble de contraintes complet X∩M, FBSE adopte une stratégie d'«enveloppe partielle»:
- Élimine la contrainte convexe x∈X par technique d'enveloppe
- Préserve la contrainte d'égalité non-convexe c(x)=0
- Évite les difficultés de calcul de projection sur ensemble non-convexe
Lemme 3.2: Pour tout x∈X∩M, on a J(x)∇c(x)=0
Lemme 3.3: Pour tout d∈range(NX(x)), on a J(x)d=d
Ces propriétés garantissent que:
- Aux points réalisables, J(x) projette le gradient sur l'espace tangent
- L'information des directions du cône normal est préservée
Proposition 3.9: Si x∈X∩M est un point stationnaire du premier ordre de NCP, alors x est un point stationnaire du premier ordre de FBSE.
Théorème 3.10 (Résultat théorique principal): Pour μ suffisamment petit avec μ≤μmax, si x∈Kρ est un point stationnaire du premier ordre de FBSE, alors x est un point stationnaire du premier ordre de NCP.
Clé de la preuve: Démonstration que ∥Tμ(x)−x∥=0, combinée avec la définie-positivité inférieure de ∇c(x)⊤Q(Tμ(x))∇c(x) (≥σQ/4).
Conception de l'algorithme (équation 3.20):
gk=μ1(In−∇c(xk)∇c(xk)†)(xk−Tμ(xk))xk+1=ΠM(xk−ηkgk)
Avantages:
- Utilise μ1(x−Tμ(x)) comme évaluation inexacte de ∇ψμ
- Évite le calcul de H(x) (impliquant le Hessien)
- Projection sur null(∇c(xk)⊤) (espace tangent de M)
Proposition 3.13: Propriété de descente suffisante
⟨(In−∇c(x)∇c(x)†)∇ψμ(x),Tμ(x)−x⟩≤−2μ1(8MQMc2+2σQσQ)2∥x−Tμ(x)∥2
Problème d'optimisation:
minX∈Sn×n⟨B,X⟩+21⟨X,H(X)⟩+6ν∥X∥F3s.c.∥X∥F2=1,X⪰0,∥X∥2≤M
- Tailles testées: n∈{10,20,30,50}
- B∈Sn×n généré aléatoirement (distribution normale standard)
- H:Sn×n→Sn×n application linéaire auto-adjointe
- Paramètres: ν=1.0, M=106, μ=0.01
Problème d'optimisation:
minX∈Rn×n⟨B0,X⟩+21⟨X,H(X)⟩+6ν∥X∥F3s.c.B(X)=b,X⪰0,∥X∥2≤M
- Tailles testées: n∈{10,20,30,50}
- B:Sn×n→Rm application linéaire
- Paramètres: ν=1.0, μ=0.001
- Stationnarité: dist(0,∇f(y)+NX(y)+range(∇c(y))), où y=ΠX(x)
- Violation de réalisabilité: ∥c(ΠX(x))∥
- Valeur de la fonction objectif
- Nombre d'itérations et nombre d'évaluations de fonction
- Temps CPU (secondes)
- PGD: Méthode de descente de gradient projeté proposée (utilisant pas de Barzilai-Borwein adaptatif et recherche linéaire non-monotone)
- TRCON: Optimiseur d'optimisation avec région de confiance de SciPy
- SLSQP: Programmation linéaire par moindres carrés séquentiels de SciPy
- RGD: Descente de gradient riemannienne de PyManopt
- RCG: Gradient conjugué riemannien de PyManopt
- Environnement de programmation: Python 3.12.2
- Matériel: CPU AMD Ryzen 7 5700, RAM 16 GB
- Tolérance: 10−5
- Temps d'exécution maximal: 300 secondes
- Application de projection (Expérience 1):
Q(X):Y↦Φ(X2ΘM(X)2Y)
où Φ(M)=(M+M⊤)/2 est l'opérateur de symétrisation
| n | Solveur | Valeur objectif | Itérations | Stationnarité | Réalisabilité | Temps CPU(s) |
|---|
| 10 | PGD | -9.446e-01 | 94 | 5.435e-06 | 0.000e+00 | 0.218 |
| TRCON | -9.446e-01 | 86 | 1.525e-05 | 9.864e-11 | 0.483 |
| RGD | -9.663e-01 | 65 | 1.207e-01 | 8.476e-02 | 0.308 |
| 20 | PGD | -1.658e+00 | 94 | 8.917e-06 | 2.220e-16 | 0.231 |
| TRCON | -1.658e+00 | 76 | 4.922e-05 | 1.644e-12 | 0.728 |
| 30 | PGD | -1.847e+00 | 84 | 4.833e-06 | 4.441e-16 | 0.351 |
| TRCON | -1.847e+00 | 65 | 8.923e-05 | 3.127e-11 | 1.299 |
| 50 | PGD | -2.323e+00 | 91 | 5.830e-06 | 2.220e-16 | 1.082 |
| TRCON | -2.323e+00 | 67 | 1.216e-04 | 9.163e-11 | 31.039 |
Découvertes clés:
- Haute précision: PGD et TRCON atteignent tous deux la tolérance 10−5, avec valeurs objectif identiques
- Efficacité: PGD est 28.7 fois plus rapide que TRCON pour n=50 (1.082s vs 31.039s)
- Échec des méthodes riemanniennes: Les indicateurs de stationnarité de RGD et RCG sont à l'ordre 10−1, loin de la convergence
- Échec de SLSQP: Dépassement du délai pour n≥30
| n | Solveur | Valeur objectif | Itérations | Stationnarité | Réalisabilité | Temps CPU(s) |
|---|
| 10 | PGD | 1.090e+03 | 97 | 3.604e-06 | 8.555e-13 | 0.205 |
| TRCON | 1.090e+03 | 204 | 1.289e-05 | 1.158e-12 | 0.893 |
| 20 | PGD | 3.330e+03 | 274 | 7.954e-06 | 4.433e-13 | 0.811 |
| TRCON | 3.330e+03 | 510 | 3.451e-05 | 1.592e-12 | 6.337 |
| 30 | PGD | 2.936e+04 | 173 | 7.645e-06 | 1.775e-12 | 3.350 |
| TRCON | 2.935e+04 | 349 | 8.346e-05 | 7.227e-11 | 19.249 |
| 50 | PGD | 8.555e+04 | 262 | 6.413e-06 | 5.687e-12 | 7.197 |
| TRCON | - | - | - | - | >300 |
Découvertes clés:
- Scalabilité: PGD résout le problème en 7.2 secondes pour n=50 tandis que TRCON dépasse le délai
- Avantage de vitesse: PGD est 5.7 fois plus rapide que TRCON pour n=30
- Échec complet de SLSQP: Tous les cas de test n'ont pas convergé ou sont numériquement instables
- Vérification de l'équivalence: Les expériences confirment l'équivalence théorique des points stationnaires du premier ordre entre NCP et FBSE (PGD et TRCON obtiennent des valeurs objectif identiques)
- Efficacité du gradient inexacte: L'utilisation de μ1(x−Tμ(x)) comme approximation du gradient, évitant le calcul de H(x), garantit toujours la convergence
- Limitations des méthodes riemanniennes:
- RGD/RCG optimisent sur la variété sphérique, mais ne considèrent pas la contrainte PSD
- Les indicateurs de stationnarité sont mauvais, indiquant que les points stationnaires de NCP n'ont pas été trouvés
- Défis des solveurs génériques:
- SLSQP est sensible aux contraintes non-convexes, numériquement instable
- TRCON est fiable mais coûteux en calcul
- Avantages de FBSE:
- Transforme les problèmes avec contraintes non-convexes en problèmes avec contraintes d'égalité
- Préserve la structure du problème
- Permet la conception d'algorithmes efficaces
- Patrinos & Bemporad (2013): Première proposition pour optimisation composite convexe
- Stella et al. (2017): Méthode quasi-Newton
- Themelis et al. (2018): Algorithme avec recherche linéaire non-monotone
- Limitation: Nécessite la convexité de X, inapplicable à X∩M
- Moreau (1965): Technique de lissage classique
- Davis & Drusvyatskiy (2019): Méthode de sous-gradient stochastique pour fonctions faiblement convexes
- Limitation: Les sous-problèmes n'ont généralement pas de solution en forme fermée, pratiquement incalculables
- Xiao et al. (2025): Propose l'application de dissolution de contraintes A(x) et la fonction de pénalité exacte
- Différence avec cet article: FBSE évite d'introduire un paramètre de pénalité, traite directement les contraintes d'égalité
- Programmation Quadratique Successive (SQP): Nécessite l'information du second ordre
- Méthode du Lagrangien Augmenté: Nécessite l'ajustement du paramètre de pénalité et du multiplicateur de Lagrange
- Avantage de cet article: Nécessite uniquement l'information du premier ordre, sélection de paramètres simple
- Absil et al. (2008): Algorithmes d'optimisation sur variétés
- Lien avec cet article: Lorsque M est une variété, FBSE peut être vu comme cas particulier de l'optimisation sur variétés
- Extension de cet article: Traite des contraintes d'égalité non-linéaires plus générales
- Contributions théoriques:
- Établissement de l'équivalence entre NCP et FBSE aux points stationnaires du premier ordre (Théorème 3.10)
- Preuve de la lissité Lipschitz de ψμ (Lemme 3.7)
- Relation entre les points ε-stationnaires (Théorème 3.12)
- Contributions algorithmiques:
- Proposition d'une méthode de descente de gradient projeté inexacte évitant le calcul du Hessien
- Preuve de la complexité itérative O(ε−2) (Théorème 3.17)
- Vérification expérimentale de l'efficacité de l'algorithme
- Contributions méthodologiques:
- Stratégie d'«enveloppe partielle»: traitement sélectif des contraintes
- Sans paramètre de pénalité: évite les difficultés d'ajustement de paramètres
- Conception modulaire: peut être combinée avec les solveurs existants pour contraintes d'égalité
- Condition de non-dégénérescence des contraintes (Hypothèse 1.1(3)): Nécessite ∇c(x)⊤lin(TX(x))=Rp, peut ne pas être satisfaite dans certaines applications
- Propriétés locales: L'équivalence ne tient que dans le voisinage Kρ de K, où ρ dépend de plusieurs constantes
- Paramètre d'enveloppe μ: Nécessite μ≤μmax, où μmax implique plusieurs constantes difficiles à estimer (Tableaux 1-2)
- En pratique: L'article suggère l'utilisation d'estimations adaptatives ou de techniques de Monte-Carlo, mais ne discute pas en détail
- Dépend de la structure du problème: Nécessite la construction de Q(x) satisfaisant l'Hypothèse 1.2 pour chaque X spécifique
- Tableau 3 couvre uniquement les cas courants: Pour les contraintes complexes, la construction de Q(x) peut être non-triviale
- Tailles de test limitées: Maximum n=50, problèmes à grande échelle non testés
- Types de problèmes uniques: Uniquement des problèmes SDP testés, autres scénarios d'application non vérifiés
- Extensions théoriques:
- Relâchement de la condition de non-dégénérescence des contraintes
- Analyse de la convergence globale (plutôt que l'équivalence locale)
- Étude des propriétés de convergence du second ordre
- Améliorations algorithmiques:
- Développement de stratégies de sélection adaptative de μ
- Incorporation d'information du second ordre (comme BFGS) pour accélérer la convergence
- Conception d'algorithmes spécialisés pour structures particulières
- Extensions d'Application:
- Test sur plus de scénarios d'application (apprentissage automatique, traitement du signal)
- Traitement de problèmes à grande échelle
- Extension aux contraintes d'inégalité
- Enveloppe Partielle de Moreau:
- L'article mentionne mais ne discute pas en détail ψM,μ(x):=argminy∈Xf(y)+2μ1∥y−x∥2
- Peut être applicable aux fonctions objectif non-lisses
- Cadre théorique complet: De la bonne définition (Lemme 3.1) à l'équivalence (Théorème 3.10) à la convergence (Théorème 3.17), logique rigoureuse
- Lemmes techniques abondants: Les Lemmes 3.2-3.8 fournissent une base solide pour les théorèmes principaux
- Constantes explicites: Les Tableaux 1-2 énumèrent en détail toutes les constantes pertinentes, facilitant l'analyse théorique
- Idée d'enveloppe partielle: Première proposition d'une stratégie de traitement sélectif des contraintes, dépassant les limitations des méthodes d'enveloppe traditionnelles
- Conception sans paramètre de pénalité: Comparée à la méthode de dissolution de contraintes, évite les difficultés d'ajustement du paramètre de pénalité
- Technique de gradient inexacte: Utilisation ingénieuse de μ1(x−Tμ(x)), réduisant la complexité de calcul
- Facile à implémenter: Les projections sur M et X ont des méthodes existantes
- Numériquement stable: Les indicateurs de stationnarité dans les expériences atteignent l'ordre 10−6
- Efficace en calcul: Accélération significative par rapport à TRCON (jusqu'à 28.7 fois)
- Structure raisonnable: De la motivation à la théorie aux expériences, niveaux clairs
- Notation standardisée: La Section 2.1 définit spécialement les symboles, évitant la confusion
- Preuves détaillées: Les étapes de preuve des théorèmes clés sont claires
- Praticité de μmax: La définition de μmax dans le Tableau 2 implique sup et inf, difficile à calculer en pratique
- Absence de propriétés globales: Pas de discussion sur comment l'algorithme entre dans le voisinage Kρ
- Dépendance des constantes: ρ et μmax dépendent de plusieurs constantes difficiles à estimer, pouvant conduire à des estimations conservatrices
- Comparaisons incomplètes:
- Pas de comparaison avec des solveurs SDP spécialisés (comme SDPT3, MOSEK)
- Pas de test de la méthode du Lagrangien augmenté
- Diversité insuffisante des problèmes: Uniquement des problèmes SDP testés, autres applications non couvertes (comme optimisation sur variétés, apprentissage automatique)
- Scalabilité inconnue: Maximum n=50, performance sur problèmes à grande échelle non vérifiée
- Construction de l'application de projection:
- Le Tableau 3 ne fournit que 4 types courants de contraintes pour Q(x)
- Pour les contraintes complexes (comme l'intersection de plusieurs contraintes), la construction de Q(x) peut être difficile
- Limitations des hypothèses: La condition de non-dégénérescence des contraintes peut ne pas être satisfaite dans certains problèmes
- Sélection du pas: L'équation (3.22) donne ηmax, mais l'algorithme réel utilise le pas de Barzilai-Borwein, la relation entre les deux n'est pas claire
- Exigence du point initial: L'algorithme nécessite x0∈X∩M, mais comment obtenir un point initial réalisable n'est pas discuté
- Enveloppe Partielle de Moreau: Mentionnée mais non analysée en détail, c'est un regret
- Signification théorique:
- Extension de l'applicabilité des méthodes d'enveloppe (des contraintes convexes aux contraintes mixtes)
- Fourniture de nouveaux outils théoriques (cadre d'enveloppe partielle)
- Signification méthodologique:
- Inspiration pour la stratégie de «traitement sélectif des contraintes»
- Nouvelle perspective pour l'optimisation avec contraintes non-convexes
- Application immédiate: Peut être utilisée pour résoudre des problèmes SDP, optimisation sur variétés, etc.
- Application potentielle: Optimisation avec contraintes en apprentissage automatique (comme contraintes d'équité, contraintes de parcimonie)
- Implémentation logicielle: L'équipe d'auteurs a l'expérience du développement du package CDOpt, peut publier une boîte à outils
- Avantages:
- Description claire de l'algorithme (équation 3.20)
- Configuration expérimentale détaillée
- Formules concrètes pour les applications de projection (Tableau 3)
- Insuffisances:
- Code non publié
- Certains détails d'implémentation (comme paramètres spécifiques de la recherche linéaire non-monotone) non donnés
- Court terme:
- Relâchement des hypothèses théoriques
- Extension aux contraintes d'inégalité
- Vérification sur plus d'applications
- Long terme:
- Développement d'une théorie générale d'«enveloppe partielle»
- Combinaison avec d'autres techniques d'optimisation (comme ADMM, méthodes proximales)
- Versions distribuées/stochastiques
- Structure des contraintes:
- X est un ensemble convexe simple (projection facile à calculer)
- c(x)=0 est une contrainte d'égalité lisse
- Satisfait la condition de non-dégénérescence des contraintes
- Taille du problème: Moyenne (n∼102)
- Exigence de précision: Précision moyenne (ε∼10−5)
- Programmation Semi-Définie: Vérifiée par les expériences
- Optimisation sur Variétés: Comme optimisation sur variété de Stiefel
- Apprentissage Automatique:
- Entraînement de réseaux de neurones avec contraintes d'égalité
- Problèmes de classification avec contraintes d'équité
- Traitement du Signal: Problèmes de récupération avec contraintes de norme
- Contraintes d'inégalité dominantes: FBSE traite uniquement les contraintes d'égalité
- Projection sur X difficile: Comme X est un ensemble non-convexe complexe
- Exigence de très haute précision: La complexité O(ε−2) peut être insuffisante
- Problèmes à très grande échelle: Le calcul de projection et de gradient peut devenir goulot d'étranglement
- Stella et al. (2017): Forward–backward quasi-newton methods for nonsmooth optimization problems. Computational Optimization and Applications
- Extension quasi-Newton de l'enveloppe avant-arrière
- Xiao et al. (2023): Dissolving constraints for Riemannian optimization. Mathematics of Operations Research
- Fondation théorique de la méthode de dissolution de contraintes
- Xiao et al. (2025): An exact penalty approach for equality constrained optimization over a convex set. arXiv preprint
- Travail précédent de cet article, proposant l'application de dissolution de contraintes
- Absil et al. (2008): Optimization algorithms on matrix manifolds. Princeton University Press
- Manuel classique de l'optimisation sur variétés
- Rockafellar & Wets (2009): Variational analysis. Springer
- Fondation théorique de l'analyse variationnelle, utilisée pour l'analyse de projection et cône normal
Évaluation Globale: Ceci est un excellent article avec rigueur théorique et innovation méthodologique. L'idée d'«enveloppe partielle» offre une nouvelle perspective pour traiter les problèmes d'optimisation avec contraintes mixtes, l'analyse théorique est complète, et les expériences numériques vérifient initialement l'efficacité de la méthode. Les principales insuffisances résident dans la praticité des constantes théoriques, la complétude des expériences et la vérification de scalabilité sur problèmes à grande échelle. Ce travail apporte une contribution importante au domaine de l'optimisation avec contraintes non-convexes, avec valeur académique et potentiel d'application élevés. Il est recommandé que les travaux ultérieurs se concentrent sur le relâchement des hypothèses théoriques, des tests d'application plus larges et le traitement de problèmes à grande échelle.