2025-11-22T01:16:16.023348

Stroke Prediction using Clinical and Social Features in Machine Learning

Chadha
Every year in the United States, 800,000 individuals suffer a stroke - one person every 40 seconds, with a death occurring every four minutes. While individual factors vary, certain predictors are more prevalent in determining stroke risk. As strokes are the second leading cause of death and disability worldwide, predicting stroke likelihood based on lifestyle factors is crucial. Showing individuals their stroke risk could motivate lifestyle changes, and machine learning offers solutions to this prediction challenge. Neural networks excel at predicting outcomes based on training features like lifestyle factors, however, they're not the only option. Logistic regression models can also effectively compute the likelihood of binary outcomes based on independent variables, making them well-suited for stroke prediction. This analysis will compare both neural networks (dense and convolutional) and logistic regression models for stroke prediction, examining their pros, cons, and differences to develop the most effective predictor that minimizes false negatives.
academic

Schlaganfallvorhersage mittels klinischer und sozialer Merkmale im maschinellen Lernen

Grundinformationen

Zusammenfassung

Jährlich erleiden 800.000 Menschen in den USA einen Schlaganfall, alle 40 Sekunden tritt ein Schlaganfall auf, und alle 4 Minuten stirbt eine Person an einem Schlaganfall. Als zweithäufigste Ursache für Todesfälle und Behinderungen weltweit ist die Vorhersage der Schlaganfallwahrscheinlichkeit auf Grundlage von Lebensstilfaktoren von entscheidender Bedeutung. Diese Studie vergleicht die Leistung von neuronalen Netzen (dicht und konvolutiv) mit logistischen Regressionsmodellen bei der Schlaganfallvorhersage mit dem Ziel, den wirksamsten Prädiktor zu entwickeln, um falsch-negative Ergebnisse zu minimieren.

Forschungshintergrund und Motivation

Problemdefinition

Die Schlaganfallvorhersage ist ein kritisches Gesundheitsproblem, das mehrere interne und externe Faktoren umfasst:

  • Externe Faktoren: Familienstand, Berufstyp, Wohnumgebung usw.
  • Interne Faktoren: Herzerkrankungsgeschichte, BMI, Alter, Blutzuckerspiegel usw.

Bedeutung

  1. Auswirkungen auf die öffentliche Gesundheit: Schlaganfall ist die zweithäufigste Ursache für Todesfälle und Behinderungen weltweit
  2. Präventionswert: Frühe Risikobewertung kann Lebensstiländerungen motivieren
  3. Klinische Anwendung: Echtzeitrisikobewertung kann in routinemäßige Untersuchungen integriert werden

Bestehende Einschränkungen

  • Mangel an umfassenden Vorhersagemodellen, die klinische und soziale Merkmale effektiv kombinieren
  • Im medizinischen Kontext wurde die Schädlichkeit falsch-negativer Ergebnisse nicht ausreichend beachtet
  • Begrenzte Vergleichsstudien verschiedener maschineller Lernmethoden bei der Schlaganfallvorhersage

Kernbeiträge

  1. Multi-Modell-Vergleichsrahmen: Systematischer Vergleich der Leistung von logistischer Regression, dichten neuronalen Netzen und Faltungsneuronalen Netzen bei der Schlaganfallvorhersage
  2. Medizinisch orientierte Bewertungsstrategie: Fokus auf Minimierung falsch-negativer Ergebnisse, entsprechend den praktischen Anforderungen medizinischer Szenarien
  3. Umfassende Merkmalsanalyse: Integration klinischer Indikatoren und sozialer Faktoren für eine ganzheitliche Risikobewertung
  4. Praktische Multi-Modell-Systemempfehlungen: Vorschlag einer gestuften Vorhersage-Pipeline, die die Vorteile mehrerer Modelle kombiniert

Methodische Details

Aufgabendefinition

  • Eingabe: Patientendaten mit 10 Merkmalen (Alter, Geschlecht, Bluthochdruck, Herzerkrankung, Familienstand, Berufstyp, Wohntyp, durchschnittlicher Blutzuckerspiegel, BMI, Raucherstatus)
  • Ausgabe: Binäres Klassifizierungsergebnis (0: kein Schlaganfall, 1: Schlaganfall vorhanden)
  • Einschränkungen: Minimierung falsch-negativer Ergebnisse, Ausgleich zwischen Präzision und Recall

Modellarchitekturen

1. Logistische Regressionsmodell

  • Vorverarbeitung: StandardScaler für Merkmalsnormalisierung, Label Encoder für kategorische Variablen
  • Regularisierung: L2-Regularisierung zur Vermeidung von Überanpassung
  • Optimierung: Maximale Iterationen von 10.000 zur Gewährleistung der Konvergenz
  • Entscheidungsgrenze: Wahrscheinlichkeitsschwelle von 0,5 (anpassbar)

2. Neuronale Netzwerk-Modelle

Dichtes neuronales Netz (DNN):

  • Eingabeschicht: 10 Merkmale
  • Verborgene Schichten: Mit Batch Normalization und Dropout
  • Aktivierungsfunktion: ReLU
  • Ausgabeschicht: Einzelnes Neuron mit Sigmoid-Aktivierung

Faltungsneuronales Netz (CNN):

  • Ähnliche Architektur, aber mit Faltungsschichten zur Merkmalverarbeitung
  • Enthält Pooling-Schichten und vollständig verbundene Schichten

Trainingsparameter:

  • Verlustfunktion: Cross Entropy Loss (geeignet für Klassenunausgeglichenheit)
  • Optimierer: Adam (adaptive Lernrate)
  • Trainings-Epochen: 400
  • Regularisierung: Dropout + Batch Normalization

Technische Innovationen

  1. Multi-Architektur-Vergleich: Erstmaliger systematischer Vergleich der CNN- und DNN-Leistung bei der Schlaganfallvorhersage mit Tabellendaten
  2. Medizinisch orientiertes Design: Verwendung gewichteter Verlustfunktionen zur Behandlung von Klassenunausgeglichenheit
  3. Merkmalswichtigkeitsanalyse: Analyse biologischer Faktoren durch logistische Regressionskoeffizienten
  4. Statistische Robustheitsprüfung: Bootstrap-Resampling zur Berechnung von 95%-Konfidenzintervallen

Experimentelle Einrichtung

Datensatz

  • Quelle: Kaggle-Schlaganfall-Vorhersagedatensatz
  • Umfang: Etwa 5.000 Proben
  • Klassenverteilung: Stark unausgeglichen (nur 5-6% Schlaganfälle)
  • Aufteilung: 80% Trainingssatz, 20% Testsatz
  • Merkmale: 10 klinische und soziale Merkmale

Bewertungsmetriken

  • Genauigkeit (Accuracy): Gesamtkorrektheit
  • Recall (Sensitivität): Fähigkeit, echte Schlaganfälle zu erkennen (Hauptfokus)
  • Präzision (Precision): Genauigkeit der Schlaganfall-Vorhersagen
  • F1-Score: Harmonisches Mittel aus Präzision und Recall
  • AUC-ROC: Diskriminierungsfähigkeit bei verschiedenen Schwellwerten
  • Verwechslungsmatrix: Detaillierte Klassifizierungsfehleranalyse

Vergleichsmethoden

  • Logistische Regression (Sklearn-Implementierung)
  • Dichtes neuronales Netz (PyTorch-Implementierung)
  • Faltungsneuronales Netz (PyTorch-Implementierung)

Implementierungsdetails

  • Framework: PyTorch (neuronale Netze), Sklearn (logistische Regression)
  • Hardware: Standardrechenumgebung
  • Reproduzierbarkeit: Feste Zufallssamen, Open-Source-Code

Experimentelle Ergebnisse

Hauptergebnisse

ModellGenauigkeitRecallPräzisionF1-Score
Logistische Regression74,95%75,81%16,31%-
Dichtes neuronales Netz86,50%43,55%20,77%-
Faltungsneuronales Netz78,67%53,23%--

Wichtigste Erkenntnisse

  1. Kompromiss zwischen Genauigkeit und Recall:
    • Dichtes neuronales Netz erreicht höchste Genauigkeit (86,50%), aber niedrigerer Recall (43,55%)
    • Logistische Regression hat höchsten Recall (75,81%), aber niedrigere Präzision (16,31%)
    • CNN erreicht Ausgleich zwischen beiden
  2. Merkmalswichtigkeitsanalyse:
    • Alter ist der wichtigste Prädiktor (entspricht medizinischem Wissen)
    • BMI-Wichtigkeit niedriger als erwartet (widerspricht bestehender Forschung)
  3. Trainingsdynamik:
    • CNN konvergiert nach 50 Epochen langsam
    • DNN zeigt kontinuierliche Verbesserung über alle 400 Epochen
    • Keine offensichtliche Überanpassung

Statistische Signifikanz

Bootstrap-Resampling (1.000 Iterationen) zur Berechnung von 95%-Konfidenzintervallen:

  • DNN-Genauigkeit: 86,50% 84,32%, 88,68%
  • DNN-Recall: 43,55% 39,87%, 47,23%
  • Logistische Regression Genauigkeit: 74,95% 72,63%, 77,27%
  • Logistische Regression Recall: 75,81% 72,14%, 79,48%

Verwandte Arbeiten

Das Papier zitiert mehrere relevante Studien:

  1. Shao et al. (2024): Betonung der Bedeutung von BMI und Alter als biologische Prädiktoren
  2. Gupta et al. (2025): Neuronale Netzwerk-basierte Schlaganfall-Vorhersagemodelle
  3. Zhang et al. (2022): Anwendung von Mehrschicht-Perceptrons bei der Schlaganfallvorhersage

Vorteile dieser Studie gegenüber bestehenden Arbeiten:

  • Systematischer Vergleich mehrerer maschineller Lernmethoden
  • Fokus auf Minimierung falsch-negativer Ergebnisse
  • Umfassende Analyse, die klinische und soziale Merkmale kombiniert

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Modellwahl hängt vom Anwendungsszenario ab:
    • Logistische Regression: Geeignet für Initialscreening (hoher Recall, starke Interpretierbarkeit)
    • Dichtes neuronales Netz: Geeignet für präzise Bewertung (hohe Genauigkeit, niedrige falsch-positive Ergebnisse)
    • CNN: Ausgewogene Leistung, geeignet als Validierungswerkzeug
  2. Multi-Modell-Systemempfehlung:
    • Erste Phase: Logistische Regression für Initialscreening
    • Zweite Phase: DNN für präzise Bewertung von Hochrisikopatienten
    • Dritte Phase: CNN für Validierung und Ausgleich

Einschränkungen

  1. Datenunausgeglichenheit: Nur 5-6% positive Fälle begrenzen die Lernfähigkeit des Modells
  2. Anomalien bei Merkmalswichtigkeit: Niedrigere BMI-Wichtigkeit als erwartet kann die Vorhersagegenauigkeit beeinflussen
  3. Verallgemeinerungsfähigkeit: Ein einzelner Datensatz kann die Universalität des Modells begrenzen
  4. Stichprobengröße: 5.000 Proben sind relativ klein, besonders bei positiven Fällen

Zukünftige Richtungen

  1. Datenerweiterung: Sammlung mehr echter Schlaganfall-Patientendaten zur Linderung von Klassenunausgeglichenheit
  2. Merkmalstechnik: Neubewertung und Optimierung der Merkmalsauswahlstrategie
  3. Modellintegration: Entwicklung ausgefeilteren Multi-Modell-Fusionsmethoden
  4. Klinische Validierung: Validierung der Modellleistung in echten medizinischen Umgebungen

Tiefgreifende Bewertung

Stärken

  1. Praktische Ausrichtung: Klarer Fokus auf die praktische Anforderung der Minimierung falsch-negativer Ergebnisse in medizinischen Szenarien
  2. Umfassende Methodik: Systematischer Vergleich traditioneller maschineller Lernmethoden und Deep Learning
  3. Statistische Strenge: Verwendung von Bootstrap-Methoden zur Validierung der Robustheit der Ergebnisse
  4. Reproduzierbarkeit: Vollständiger Code und Daten mit MIT-Open-Source-Lizenz
  5. Klinische Relevanz: Integration anerkannter Risikofaktoren aus dem medizinischen Bereich

Schwächen

  1. Datenqualität: Schwerwiegende Klassenunausgeglichenheit nicht ausreichend gelöst
  2. Modelltiefe: Relativ einfache neuronale Netzwerk-Architektur, nicht vollständige Erkundung des Deep-Learning-Potenzials
  3. Unzureichende Merkmalstechnik: Anomale BMI-Wichtigkeit deutet auf mögliche Probleme bei der Merkmalverarbeitung hin
  4. Bewertungslimitierungen: Fehlender Vergleich mit bestehenden klinischen Risikobewertungswerkzeugen
  5. Experimenteller Umfang: Einzelner Datensatz, fehlende datensatzübergreifende Validierung

Auswirkungen

  1. Akademischer Beitrag: Bietet praktischen Multi-Modell-Vergleichsrahmen für medizinische KI
  2. Klinischer Wert: Vorgeschlagenes gestuftes Vorhersagesystem hat praktisches Anwendungspotenzial
  3. Methodologische Bedeutung: Unterstreicht die Wichtigkeit der Kontrolle falsch-negativer Ergebnisse in medizinischer KI
  4. Skalierbarkeit: Methode kann auf andere medizinische Vorhersageaufgaben übertragen werden

Anwendungsszenarien

  1. Primärmedizinische Versorgung: Logistisches Regressionsmodell geeignet für Screening in Gemeindekliniken
  2. Fachkrankenhäuser: Dichtes neuronales Netz geeignet für präzise Risikobewertung
  3. Gesundheitsmanagement: Kann in persönliche Gesundheitsüberwachungsanwendungen integriert werden
  4. Klinische Forschung: Bietet Werkzeuge für Schlaganfall-Risikofaktor-Forschung

Literaturverzeichnis

  1. CDC. Preventing stroke deaths. https://www.cdc.gov/vitalsigns/pdf/2017-09-vitalsigns.pdf
  2. Shao, Y., et al. (2024). Link between triglyceride-glucose-body mass index and future stroke risk in middle-aged and elderly Chinese. Cardiovascular Diabetology.
  3. Gupta, A., et al. (2025). Predicting stroke risk: An effective stroke prediction model based on neural networks. Journal of Neurorestoratology.

Gesamtbewertung: Diese Studie bietet eine wertvolle Multi-Modell-Vergleichsanalyse für das wichtige medizinische Problem der Schlaganfallvorhersage, wobei die Betonung der Kontrolle falsch-negativer Ergebnisse die praktischen Anforderungen medizinischer KI widerspiegelt. Trotz Einschränkungen wie Datenunausgeglichenheit hat die vorgeschlagene Multi-Modell-Systemarchitektur praktischen Anwendungswert und bietet einen guten Referenzrahmen für ähnliche Forschungen im Bereich medizinische KI.