Predicting outcomes in external domains is challenging due to hidden confounders that potentially influence both predictors and outcomes. Well-established methods frequently rely on stringent assumptions, explicit knowledge about the distribution shift across domains, or bias-inducing regularization schemes to enhance generalization. While recent developments in point prediction under hidden confounding attempt to mitigate these shortcomings, they generally do not provide principled uncertainty quantification. We introduce a Bayesian framework that yields well-calibrated predictive distributions across external domains, supports valid model inference, and achieves posterior contraction rates that improve as the number of observed datasets increases. Simulations and a medical application highlight the remarkable empirical coverage of our approach, nearly unchanged when transitioning from low- to moderate-dimensional settings.
academic
Prädiktive Posteriori unter verborgener Konfundierung
Die Vorhersage von Ergebnissen in externen Domänen ist eine Herausforderung, da verborgene Konfundierungsfaktoren sowohl Prädiktorvariablen als auch Ergebnisvariablen beeinflussen können. Bestehende Methoden stützen sich typischerweise auf strenge Annahmen, erfordern explizites Wissen über Verteilungsverschiebungen zwischen Domänen oder führen Regularisierungsschemata ein, die Verzerrungen verursachen, um die Verallgemeinerungsfähigkeit zu verbessern. Obwohl Punktvorhersagemethoden unter verborgener Konfundierung versuchen, diese Mängel zu beheben, können sie typischerweise keine prinzipiellen Unsicherheitsquantifizierungen bereitstellen. Dieser Artikel führt einen Bayes'schen Rahmen ein, der gut kalibrierte Vorhersageverteilungen in externen Domänen erzeugt, effiziente Modellschlussfolgerungen unterstützt und Posterior-Schrumpfungsraten erreicht, die sich mit zunehmender Anzahl von Beobachtungsdatensätzen verbessern. Simulationsstudien und medizinische Anwendungen heben die bemerkenswerte empirische Abdeckungsrate der Methode hervor, die über Übergänge von niedrig- zu mitteldimensionalen Einstellungen hinweg nahezu unverändert bleibt.
Das Kernproblem dieser Forschung ist: Wie können zuverlässige probabilistische Vorhersagen in externen Domänen mit Verteilungsverschiebung durchgeführt und kalibrierte Unsicherheitsquantifizierungen bereitgestellt werden, wenn verborgene Konfundierungsfaktoren vorhanden sind?
Allgegenwärtigkeit von Verteilungsverschiebungen: Maschinelle Lerneanwendungen stoßen häufig auf Inkonsistenzen zwischen Trainings- und Testdomänenverteilungen, was die standardmäßige iid-Annahme in Frage stellt
Auswirkungen verborgener Konfundierung: Nicht beobachtete Konfundierungsvariablen beeinflussen sowohl Prädiktorvariablen X als auch Ergebnisvariablen Y, was zum Versagen traditioneller Methoden führt
Bedarf an Unsicherheitsquantifizierung: Bestehende Methoden konzentrieren sich hauptsächlich auf Punktvorhersagen und ermangeln eines prinzipiellen Unsicherheitsquantifizierungsmechanismus
Verteilungsrobuste Optimierung: Verwendet Minimax-Optimierung, erfordert aber die Einführung von Verzerrungen zur Verbesserung der Robustheit
Kausale Invarianzmethoden: Wie Anker-Regression, basieren auf strikten Invarianzannahmen, die bei Vorhandensein verborgener Konfundierung leicht verletzt werden
Konforme Vorhersage: Kann zwar Vorhersageintervalle bereitstellen, hat aber begrenzte Handhabung von Verteilungsverschiebungen
Bestehende kausale Methoden: Liefern hauptsächlich Punktschätzungen, ermangeln Unsicherheitsquantifizierung
Die Autoren bauen auf früheren Arbeiten zur Generativen Invarianz (GI) auf und zielen darauf ab, einen einheitlichen Bayes'schen Rahmen zu konstruieren, der zwei langfristige Herausforderungen gleichzeitig angeht: kausale Entdeckung und kalibrierte Vorhersage.
Erster Bayes'scher Rahmen: Präsentiert einen vollständigen Bayes'schen Rahmen für probabilistische Vorhersagen unter verborgener Konfundierung, der gleichzeitig kausale Entdeckung und Vorhersage ermöglicht
Theoretische Garantien: Etabliert Posterior-Konsistenz, Schrumpfungsraten und das Bernstein-von-Mises-Theorem und beweist die asymptotischen Eigenschaften der Methode
Hypothesentestfähigkeit: Bietet die erste berechenbare Hypothesentest-Methode zur Überprüfung, ob Variablen Elternknoten der Zielreaktion in linearen Strukturgleichungsmodellen sind
Kalibrierte Vorhersagen: Erreicht gut kalibrierte Vorhersagen in Verteilungsverschiebungsdomänen mit Abdeckungsraten nahe dem theoretischen Niveau
Identifizierbarkeitsspektrum: Klärt erstmals explizit schwache Identifizierbarkeit als empirische Manifestation eines asymptotischen Phänomens
Behandelt Umgebungsmittel μ_e als Zufallsgrößen, die aus einer gemeinsamen Prior-Verteilung gezogen werden, anstatt sie als feste Parameter zu behandeln, und realisiert vorteilhafte Schrumpfungseffekte.
Wenn Identifizierbarkeitsbedingungen nahe daran sind, verletzt zu werden, vermeidet die Bayes'sche Methode durch kontrollierte Schrumpfung numerische Instabilität frequentistischer Methoden.
Schlägt Entscheidungsregeln basierend auf der Posterior-Verteilung vor: Wenn min{|{i: γ_ji < 0}|, |{i: γ_ji > 0}|} < αm, wird j als kausaler Elternknoten von Y betrachtet.
Abbildung 2 zeigt das Phänomen schwacher Identifizierbarkeit: Wenn μ→0, schrumpft der Posterior zum Prior-Mittelwert und vermeidet das Matrixinvertibilitätsproblem frequentistischer Methoden.
Rothenhäusler, D., et al. (2021). Anchor regression: Heterogeneous data meet causality. Journal of the Royal Statistical Society Series B, 83(2), 215-246.
Peters, J., Bühlmann, P., & Meinshausen, N. (2016). Causal inference by using invariant prediction: Identification and confidence intervals. Journal of the Royal Statistical Society Series B, 78(5), 947-1012.
Tibshirani, R. J., et al. (2019). Conformal prediction under covariate shift. Advances in Neural Information Processing Systems, 32.
Meixide, C. G., & Insua, D. R. (2025). Unsupervised domain adaptation under hidden confounding. arXiv preprint.