Du point de vue de la réduction des données, les concepts de statistiques minimales suffisantes et de statistiques complètes jouent un rôle important dans la détermination des statistiques optimales (estimateurs). Les concepts classiques de suffisance et de complétude ne s'appliquent pas à l'estimation robuste basée sur différentes divergences. Récemment, la littérature a introduit un concept généralisé de suffisance basé sur les fonctions de vraisemblance généralisées. Il est important de noter que le seul concept de suffisance ne produit pas nécessairement des statistiques optimales. Par conséquent, en cohérence avec la suffisance généralisée, cet article introduit un concept généralisé de complétude concernant les fonctions de vraisemblance généralisées et caractérise les familles de distributions de probabilité possédant la complétude sous les fonctions de vraisemblance généralisées associées à la divergence de puissance de densité (DPD). De plus, il est démontré que les familles de distributions associées à la divergence de puissance de densité logarithmique (LDPD) ne possèdent pas la complétude. Le théorème de Lehmann-Scheffé et le théorème de Basu sont étendus à l'estimation par vraisemblance généralisée, et des estimateurs sans biais de variance minimale généralisée (UMVUE) pour la famille B(α) sont obtenus.
Importance de la réduction des données: En inférence statistique, lorsque la taille de l'échantillon est très grande, l'interprétation directe des données d'échantillon devient difficile et nécessite une réduction des données par des statistiques. La réduction idéale des données doit satisfaire deux propriétés clés: (i) ne pas perdre d'informations importantes sur le paramètre; (ii) éliminer les informations redondantes sans rapport avec le paramètre.
Limitations de la théorie classique: Le concept de statistique suffisante introduit par Fisher est basé sur la fonction de vraisemblance classique et fonctionne bien dans le cadre de l'estimation du maximum de vraisemblance. Cependant, dans les applications pratiques telles que l'inférence robuste, il est nécessaire d'aller au-delà des méthodes basées sur la vraisemblance, auquel cas les concepts classiques de suffisance et de complétude ne s'appliquent plus.
Besoin d'un cadre généralisé: Les méthodes d'estimation basées sur les divergences développées récemment (telles que MDPDE, MLDPDE, etc.) utilisent des fonctions de vraisemblance généralisées, nécessitant une théorie correspondante de suffisance et de complétude généralisées.
Introduction des concepts de complétude généralisée et d'auxiliarité: Définition des concepts de statistiques complètes généralisées et de statistiques auxiliaires généralisées basés sur les fonctions de vraisemblance généralisées
Caractérisation de la complétude de la famille B(α): Démonstration que la famille B(α) possède la complétude généralisée sous les fonctions de vraisemblance généralisées associées à la DPD
Preuve de l'incomplétude de la famille M(α): Démonstration par contre-exemple que la famille M(α) ne possède pas la complétude sous les fonctions de vraisemblance généralisées associées à la LDPD
Extension des théorèmes classiques: Extension du théorème de Lehmann-Scheffé et du théorème de Basu au cadre de l'estimation par vraisemblance généralisée
Obtention de l'UMVUE généralisée: Dérivation des estimateurs sans biais de variance minimale généralisée pour la famille B(α)
Analyse de la perte d'espérance asymptotique: Dérivation de la formule de perte d'espérance asymptotique (AED) du MDPDE par rapport à l'UMVUE généralisée
Exemples d'application: Démonstration de l'application des résultats théoriques dans un modèle de fiabilité contrainte-résistance
La tâche centrale de cet article est d'établir une théorie de complétude dans le cadre de l'estimation par vraisemblance généralisée, incluant spécifiquement:
Entrée: Famille de distributions de probabilité P = {fλ : λ ∈ Λ} et fonction de vraisemblance généralisée LG
Sortie: Critères de jugement et méthodes de construction pour les statistiques complètes généralisées
Contraintes: La fonction de vraisemblance généralisée doit satisfaire des conditions de régularité spécifiques
Définition 3.2: Soit P = {fλ : λ ∈ Λ} une famille de distributions de probabilité et LG une fonction de vraisemblance généralisée. Une statistique T est appelée statistique complète généralisée de P si, pour toute fonction h,
Théorème 3.1: Si T est une statistique complète suffisante généralisée de P, alors chaque fonction généralisée estimable τ̃(λ) possède un et un seul estimateur sans biais généralisé de la forme h(T), et h(T) est l'unique UMVUE généralisée de τ̃(λ).
Théorème 4.2: Pour la famille B(α), si l'image de w(λ) contient un rectangle d-dimensionnel, alors fˉd=[fˉ1,...,fˉd]T est une statistique complète suffisante généralisée, où fˉi=n1∑j=1nfi(yj).
Complétude de la famille B(α): Démonstration que, sous des conditions appropriées, fˉd est une statistique complète suffisante généralisée de la famille B(α)
Incomplétude de la famille M(α): Démonstration par exemple concret utilisant la distribution de Bernoulli que la famille M(α) ne possède pas la complétude généralisée
Formule AED: Pour la famille B(α), la perte d'espérance asymptotique du MDPDE par rapport à l'UMVUE généralisée est:
La statistique minimale suffisante généralisée n'est pas nécessairement complète: Démonstration par l'exemple de la famille M(α), ce qui diffère du cas classique
Relation entre complétude et structure de la famille de distributions: La famille B(α) possède la complétude tandis que la famille M(α) ne la possède pas, révélant les différences essentielles entre différentes familles de distributions généralisées
Dépendance paramétrique de la performance des estimateurs: L'analyse AED montre que la performance relative des estimateurs dépend fortement de la valeur du paramètre
Établissement réussi d'une théorie généralisée de complétude: Fourniture d'un cadre théorique complet pour l'estimation par vraisemblance généralisée, comblant un vide théorique dans ce domaine
Caractérisation de la complétude de familles de distributions importantes: Démonstration que la famille B(α) possède la complétude généralisée tandis que la famille M(α) ne la possède pas, fournissant des orientations théoriques pour les applications pratiques
Extension des théorèmes classiques: Extension réussie du théorème de Lehmann-Scheffé et du théorème de Basu au cadre généralisé
Fourniture d'outils de comparaison d'estimateurs: La formule AED fournit un outil quantitatif pour comparer différents estimateurs
Conditions de régularité: Les résultats théoriques nécessitent de satisfaire une série de conditions de régularité qui doivent être vérifiées dans les applications pratiques
Complexité de calcul: Le calcul des distributions de probabilité déformées peut être relativement complexe dans certains cas
Propriétés en échantillon fini: Les résultats principaux sont basés sur la théorie asymptotique; les propriétés en échantillon fini méritent une étude plus approfondie
Portée d'application: Actuellement principalement axée sur des familles de distributions spécifiques; l'extension à des cas plus généraux nécessite une recherche supplémentaire
Innovation théorique: Premier établissement systématique d'une théorie généralisée de complétude, fournissant une base théorique solide pour l'estimation par vraisemblance généralisée
Valeur pratique: Les résultats théoriques s'appliquent directement à l'obtention de l'UMVUE généralisée, possédant une valeur pratique importante
Complétude: Non seulement établissement de résultats positifs (complétude de la famille B(α)), mais aussi démonstration par contre-exemple de résultats négatifs (incomplétude de la famille M(α))
Orientation vers l'application: Démonstration de l'application pratique de la théorie par le modèle de fiabilité contrainte-résistance
Inférence statistique robuste: Lorsque les données contiennent des valeurs aberrantes, les méthodes basées sur les divergences sont plus robustes que les méthodes ML traditionnelles
Analyse de fiabilité: Particulièrement adaptée aux problèmes de fiabilité de type contrainte-résistance
Gestion des risques: Valeur d'application dans les scénarios tels que le risque financier nécessitant une estimation robuste
Apprentissage automatique: Fourniture de base théorique pour les algorithmes d'apprentissage automatique robustes
L'article cite 42 références importantes, couvrant les travaux classiques de la théorie statistique et le développement récent de la théorie des divergences, incluant principalement:
Fisher (1922): Théorie fondamentale de la statistique
Lehmann & Scheffé (1950): Théorie de complétude
Basu (1955, 1998): Indépendance statistique et estimation robuste
Gayen & Kumar (2016, 2023): Théorie généralisée de suffisance
Kullback & Leibler (1951): Fondements de la théorie de l'information
Évaluation Globale: Cet article est un travail théorique statistique de haute qualité qui établit un système théorique complet dans le cadre de l'estimation par vraisemblance généralisée. Bien que le seuil technique soit élevé, la contribution théorique est significative et représente un progrès important dans le développement de la théorie statistique et des méthodes statistiques robustes. La rigueur mathématique et la complétude théorique de l'article méritent d'être louées, constituant un progrès important dans ce domaine.