Dynamic Bayesian networks (DBNs) are increasingly used in healthcare due to their ability to model complex temporal relationships in patient data while maintaining interpretability, an essential feature for clinical decision-making. However, existing approaches to handling missing data in longitudinal clinical datasets are largely derived from static Bayesian networks literature, failing to properly account for the temporal nature of the data. This gap limits the ability to quantify uncertainty over time, which is particularly critical in settings such as intensive care, where understanding the temporal dynamics is fundamental for model trustworthiness and applicability across diverse patient groups. Despite the potential of DBNs, a full Bayesian framework that integrates missing data handling remains underdeveloped. In this work, we propose a novel Gibbs sampling-based method for learning DBNs from incomplete data. Our method treats each missing value as an unknown parameter following a Gaussian distribution. At each iteration, the unobserved values are sampled from their full conditional distributions, allowing for principled imputation and uncertainty estimation. We evaluate our method on both simulated datasets and real-world intensive care data from critically ill patients. Compared to standard model-agnostic techniques such as MICE, our Bayesian approach demonstrates superior reconstruction accuracy and convergence properties. These results highlight the clinical relevance of incorporating full Bayesian inference in temporal models, providing more reliable imputations and offering deeper insight into model behavior. Our approach supports safer and more informed clinical decision-making, particularly in settings where missing data are frequent and potentially impactful.
- Papier-ID: 2511.04333
- Titel: LUME-DBN: Full Bayesian Learning of DBNs from Incomplete data in Intensive Care
- Autoren: Federico Pirola (Universität Milano-Bicocca), Fabio Stella (Universität Milano-Bicocca), Marco Grzegorczyk (Universität Groningen)
- Klassifizierung: cs.LG (Maschinelles Lernen), cs.AI (Künstliche Intelligenz)
- Veröffentlichungsdatum: 6. November 2025 (arXiv-Preprint)
- Papierlink: https://arxiv.org/abs/2511.04333
Dynamische Bayessche Netze (DBNs) finden zunehmend Anwendung im Gesundheitswesen, da sie komplexe zeitliche Beziehungen in Patientendaten modellieren können, während gleichzeitig Interpretierbarkeit gewährleistet wird – ein wesentliches Merkmal für klinische Entscheidungsfindung. Allerdings stammen bestehende Methoden zur Behandlung fehlender Werte in longitudinalen klinischen Datensätzen hauptsächlich aus der Literatur zu statischen Bayesschen Netzen und berücksichtigen nicht angemessen die zeitliche Natur der Daten. Diese Lücke beschränkt die Fähigkeit zur Quantifizierung zeitlicher Unsicherheit, was besonders in der Intensivmedizin kritisch ist, wo das Verständnis zeitlicher Dynamiken für die Modellzuverlässigkeit und Anwendbarkeit über verschiedene Patientengruppen hinweg entscheidend ist. Dieses Papier schlägt eine neue Gibbs-Sampling-basierte Methode zum Lernen von DBNs aus unvollständigen Daten vor, wobei jeder fehlende Wert als unbekannter Parameter behandelt wird, der einer Gaußverteilung folgt, und durch Sampling aus vollständigen bedingten Verteilungen eine prinzipiengestützte Imputation und Unsicherheitsschätzung ermöglicht wird.
Das Kernproblem dieser Forschung besteht darin, wie man dynamische Bayessche Netze effektiv lernen kann, wenn große Mengen fehlender Daten vorhanden sind, besonders in Anwendungen in der Intensivmedizin.
- Klinische Dringlichkeit: In der Intensivmedizin ist eine zeitnahe und genaue Bewertung der Patientenerkrankungsentwicklung entscheidend für die Anleitung von Interventionsmaßnahmen
- Herausforderungen der Datenqualität: ICU-Daten sind häufig durch fehlende Werte, unregelmäßige Stichprobennahme und Messfehler beeinträchtigt
- Unsicherheitsquantifizierung: Traditionelle Methoden können die durch fehlende Werte eingeführte Unsicherheit nicht angemessen berücksichtigen, was zu verzerrten Parameterschätzungen führen kann
- Zeitliche Blindheit statischer Methoden: Bestehende Methoden zur Behandlung fehlender Daten stammen hauptsächlich aus statischen Bayesschen Netzen und berücksichtigen nicht die zeitliche Natur
- Unzulänglichkeiten frequentistischer Methoden: Traditionelle Imputations- oder frequentistische Methoden können die durch fehlende Werte eingeführte Unsicherheit möglicherweise nicht angemessen berücksichtigen
- Lokale Optimierungsprobleme: Algorithmen wie die strukturelle Erwartungsmaximierung (SEM) können in lokalen Optima steckenbleiben
Entwicklung eines vollständig Bayesschen Rahmens, der gleichzeitig Unsicherheit in Netzwerkstruktur, Parametern und fehlenden Werten behandeln kann, um zuverlässigere Unterstützung für klinische Entscheidungen zu bieten.
- Theoretischer Beitrag: Herleitung geschlossener Lösungen für vollständig bedingte Verteilungen (FCDs) fehlender Werte in DBNs mit Nachweis ihrer Handhabbarkeit
- Methodische Innovation: Vorschlag des LUME-DBN-Algorithmus, der Gibbs-Sampling für die Imputation fehlender Daten mit MCMC-Strukturlernen kombiniert
- Experimentelle Validierung: Validierung der Methodeneffektivität an simulierten und echten ICU-Daten mit überlegener Rekonstruktionsgenauigkeit im Vergleich zu Methoden wie MICE
- Klinische Anwendung: Demonstration der Methode am PhysioNet-2012-Datensatz mit Aufdeckung aussagekräftiger zeitlicher Beziehungen in verschiedenen ICU-Typen
Eingabe: Multivariate Zeitreihendaten mit fehlenden Werten D∈RN×k×(T+1), wobei N die Anzahl der Stichproben, k die Anzahl der Variablen und T+1 die Anzahl der Zeitpunkte ist
Ausgabe: Posteriori-Verteilungsstichproben von DBN-Struktur, Parametern und fehlenden Werten
Einschränkungen: Annahme von Markov-Eigenschaft erster Ordnung und Abwesenheit momentaner Effekte
Das DBN wird als k unabhängige Bayessche lineare Regressionsmodelle (BLR) modelliert:
xit=β0(i)+∑j:(Xjt−1∈π(i))βj(i)xjt−1+ϵit
wobei π(i) die Menge der Elternknoten der Variablen Xi darstellt und ϵit∼N(0,σ(i)2).
- Regressionskoeffizienten: β(i)∼N(μ(i),σ(i)2δ(i)2I)
- Rauschparameter: σ(i)2∼Inv-Gamma(a,b)
- Unsicherheitsparameter: δ(i)2∼Inv-Gamma(αδ,βδ)
- Größe der Elternknotenmenge: ∣π(i)∣∼Poisson(λ)
Für den fehlenden Wert xit[MIS] der Variablen Xi zum Zeitpunkt t ist die FCD:
P(xit[MIS]∣⋅)=N(μ∗,σ∗2)
wobei:
σ∗2=(σ(i)21+∑j:(Xit∈π(j))σ(j)2(βi(j))2)−1
μ∗=σ∗2⋅(σ(i)2μit+∑j:(Xit∈π(j))σ(j)2βi(j)(xjt+1−μ{−i}(j)(t+1)))
- Einheitliche Imputationsstrategie: Entwurf von Gibbs-Schritten zur gemeinsamen Aktualisierung fehlender Werte über alle Regressionsmodelle hinweg
- Geschlossene Lösungsherleitung: Nachweis der Handhabbarkeit der FCD fehlender Werte, was effiziente MCMC-Inferenz ermöglicht
- Zeitliche Invarianz: Die FCD-Struktur ist zeitlich invariant bezüglich DBN-Parametern und erhöht die Recheneffizienz
- Flucht aus lokalen Optima: MCMC-Sampling ermöglicht das Entkommen aus lokalen Minima für genauere Netzwerkrekonstruktion
- Struktur: 10 unabhängige 10-Knoten-DBN-Strukturen mit maximal 5 Elternknoten pro Knoten
- Zeitliche Länge: T∈{50,100,200}
- Fehlquote: {10%,20%,30%,40%}
- Parametereinstellung: Regressionskoeffizienten aus Uniform[0.2,0.8] gezogen, Rauschvarianz σ2=1
- Datenquelle: PhysioNet 2012 Challenge-Datensatz
- Patientenzahl: 20.000+ erwachsene ICU-Patienten
- Zeitfenster: Erste 48 Stunden des ICU-Aufenthalts
- Variablenzahl: 11 klinische Variablen (Vitalzeichen, Blutparameter, physiologische Merkmale)
- ICU-Gruppierung: MICU (34 Fälle), SICU (104 Fälle), CCU (114 Fälle), CSRU (62 Fälle)
- Strukturrekonstruktion: Fläche unter der Präzisions-Recall-Kurve (AUC-PR)
- Konvergenzdiagnose: Potenzieller Skalierungsreduktionsfaktor (PSRF < 1,1)
- Statistische Signifikanz: Gepaarter t-Test
- MICE: Multiple Imputation by Chained Equations
- Temporal MICE: MICE-Variante mit verzögerten Prädiktorvariablen
- Vollständige Daten: Als Leistungsobergrenze als Referenz
- Sampling-Runden: 20.000 Runden mit 5.000 Burn-in-Runden
- Aktualisierungshäufigkeit fehlender Werte: Aktualisierung alle 10 Runden (EM=10)
- Kettenausdünnung: 1 von 5 Stichproben beibehalten zur Reduktion von Autokorrelation
- Priori-Parameter: λ=1, σ(i)2=δ(i)2=1
LUME-DBN übertrifft Baseline-Methoden signifikant in allen experimentellen Einstellungen:
- MICE-Leistung: Völliger Ausfall bei Fehlquoten über 20%, was seine Ineffektivität bei zeitlichen Daten widerspiegelt
- Temporal MICE: Bessere Leistung als MICE, aber immer noch signifikant schlechter als LUME-DBN
- LUME-DBN-Vorteil: Besonders hervorragende Leistung bei hohen Fehlquoten, mit geringerem Leistungsverlust im Vergleich zu vollständigen Daten bei großen Stichproben
- Strukturkonvergenz: Konvergenz innerhalb von 1,5k Runden bei allen Fehlquoten
- Konvergenz fehlender Werte: 5k Runden erforderlich bei 40% Fehlquote
- Konvergensstabilität: Konvergenzzeit nimmt mit Fehlquote zu, konvergiert aber letztendlich immer
- Selbstregulierungsschleifen: Starke interne Verbindungen zwischen Druckparametern (MAP, Sys, Dias) und atemwegsabhängigen Variablen (FiO2, PaCO2, PaO2, pH)
- Neurologische Wechselwirkungen: Vermindertes Bewusstsein führt zu erhöhter Herzfrequenz (CCU: GCS → HR)
- Hämodynamische Effekte: Blutdruck beeinflusst stark das Bewusstseinsniveau (medizinische Patienten: Dias, MAP → GCS)
- Körpertemperatur-Regulationsdynamik: Temperaturveränderungen während chirurgischer Genesung beeinflussen Urinausscheidung (Temp → Urine)
- Kardiopulmonale Rückkopplung: Niedriger Sauerstoffgehalt löst kompensatorische Herzfrequenzerhöhung aus (FiO2 → HR)
- Lokale Normalisierung: Entdeckung weiterer ICU-spezifischer Beziehungen
- Globale Normalisierung: Netzwerk zeigt mehr Gemeinsamkeiten, aber einige Beziehungen mangelt es an klinischen Belegen
- SEM-Algorithmus: Hard-EM-Variante effektiv bei begrenzten Daten, neigt aber zum Steckenbleiben in lokalen Optima
- MCMC-Methoden: Neuere Sampling-Methoden können lokale Minima verlassen und genauere Rekonstruktionen erreichen
- Bestehende Methoden: Verwenden hauptsächlich modellunabhängige Methoden wie MICE zur Behandlung fehlender Daten
- Beitrag dieses Papiers: Erste Erweiterung von Sampling-Methoden auf die Behandlung fehlender Daten in DBNs
- Organversagenvorhersage: DBNs zur Vorhersage von Organversagensverläufen
- Vorhersage physiologischer Veränderungen: Vorhersage physiologischer Veränderungen und Todesrisiko
- Entscheidungsunterstützung: Bereitstellung interpretierbarer Entscheidungsunterstützung
- Methodeneffektivität: LUME-DBN übertrifft bestehende Methoden sowohl bei der Strukturrekonstruktion als auch bei der Imputation fehlender Werte
- Klinische Relevanz: Entdeckte zeitliche Beziehungen haben klinische Bedeutung und unterstützen sicherere klinische Entscheidungen
- Unsicherheitsquantifizierung: Der vollständig Bayessche Rahmen bietet explizite Unsicherheitskodierung für Modell, Parameter und fehlende Werte
- Rechenkomplexität: MCMC-Sampling hat hohe Rechenkosten, erfordert Parallelisierungsoptimierung
- Annahme zufälliger Fehlwerte: Aktuelle Methode behandelt nur zufällige Fehlwerte; nicht-zufällige Fehlwertmuster in klinischen Daten erfordern weitere Forschung
- Stichprobengrößenbeschränkung: Bei kleinen Stichproben können einige Beziehungen möglicherweise nicht stabil genug sein
- Vorwissen: Bessere Integration klinischen Vorwissens zur Anleitung der Modellableitung erforderlich
- MNAR-Behandlung: Integration von Fehlwertgraph-Methoden zur Behandlung nicht-zufälliger Fehlwertmuster
- Nicht-homogene DBNs: Erweiterung auf global gekoppelte nicht-homogene DBNs zur Erfassung nicht-stationärer Beziehungen
- Gemischte Variablen: Behandlung gemischter kontinuierlicher und diskreter Variablentypen
- Echtzeit-Anwendungen: Entwicklung von Echtzeit-Klinischen-Entscheidungsunterstützungssystemen
- Theoretische Strenge: Vollständige Herleitung geschlossener Lösungen für FCD fehlender Werte mit solider theoretischer Grundlage
- Methodische Innovation: Erste Anwendung vollständig Bayesscher Methoden auf DBN-Lernen aus fehlenden Daten
- Experimentelle Vollständigkeit: Validierung mit simulierten und echten Daten, Abdeckung verschiedener Fehlquoten und Stichprobengrößen
- Klinische Relevanz: Entdeckte Beziehungen haben klinische Bedeutung und validieren die praktische Anwendbarkeit der Methode
- Reproduzierbarkeit: Vollständige Algorithmusbeschreibung und Open-Source-Code bereitgestellt
- Recheneffizienz: Fehlende detaillierte Rechenzeit-Analyse und Optimierungsstrategien
- Frequentistische Vergleiche: Mangel an Vergleichen mit klassischen frequentistischen DBN-Lernmethoden
- Parameterempfindlichkeit: Unzureichende Sensitivitätsanalyse zur Hyperparameter-Auswahl
- Skalierbarkeit: Leistung bei größeren Netzwerken unbekannt
- Akademischer Beitrag: Bietet neuen theoretischen Rahmen für die Behandlung fehlender Daten in DBNs
- Praktischer Wert: Wichtige Anwendungsperspektiven in kritischen Bereichen wie dem Gesundheitswesen
- Methodische Universalität: Erweiterbar auf andere Bereiche, die Zeitreihen mit fehlenden Daten behandeln müssen
- Gesundheitswesen: ICU-Überwachung, chronische Krankheitsmanagement, klinische Studienanalyse
- Finanzen: Zeitreihen-Risikomodellierung, Marktprognose
- Industrie: Gerätegesundheitsüberwachung, Qualitätskontrolle
- Umwelt: Klimamodellierung, Umweltüberwachung
Das Papier zitiert 42 relevante Referenzen, die wichtige Arbeiten in mehreren Bereichen abdecken, einschließlich Bayessches Netzwerklernen, Behandlung fehlender Daten und medizinische Informatik, und bietet eine solide theoretische Grundlage für die Forschung.
Gesamtbewertung: Dies ist ein hochqualitatives Papier mit wichtigen methodischen Innovationen, das nicht nur theoretische Durchbrüche zeigt, sondern auch praktischen Wert in realen Anwendungen demonstriert. Obwohl es Raum für Verbesserungen bei Recheneffizienz und Methodenvergleichen gibt, sind seine Beiträge ausreichend, um die Entwicklung dieses Forschungsbereichs voranzutreiben.