Every year in the United States, 800,000 individuals suffer a stroke - one person every 40 seconds, with a death occurring every four minutes. While individual factors vary, certain predictors are more prevalent in determining stroke risk. As strokes are the second leading cause of death and disability worldwide, predicting stroke likelihood based on lifestyle factors is crucial. Showing individuals their stroke risk could motivate lifestyle changes, and machine learning offers solutions to this prediction challenge. Neural networks excel at predicting outcomes based on training features like lifestyle factors, however, they're not the only option. Logistic regression models can also effectively compute the likelihood of binary outcomes based on independent variables, making them well-suited for stroke prediction. This analysis will compare both neural networks (dense and convolutional) and logistic regression models for stroke prediction, examining their pros, cons, and differences to develop the most effective predictor that minimizes false negatives.
academic- Papier-ID: 2501.00048
- Titel: Stroke Prediction using Clinical and Social Features in Machine Learning
- Autor: Aidan Chadha (Virginia Tech)
- Klassifizierung: cs.LG cs.AI
- Veröffentlichungszeit/Konferenz: Preprint 2025
- Papierlink: https://arxiv.org/abs/2501.00048
- Codelink: https://github.com/Aidan7757/stroke_prediction_using_clinical_social_features
Jährlich erleiden 800.000 Menschen in den USA einen Schlaganfall, alle 40 Sekunden tritt ein Schlaganfall auf, und alle 4 Minuten stirbt eine Person an einem Schlaganfall. Als zweithäufigste Ursache für Todesfälle und Behinderungen weltweit ist die Vorhersage der Schlaganfallwahrscheinlichkeit auf Grundlage von Lebensstilfaktoren von entscheidender Bedeutung. Diese Studie vergleicht die Leistung von neuronalen Netzen (dicht und konvolutiv) mit logistischen Regressionsmodellen bei der Schlaganfallvorhersage mit dem Ziel, den wirksamsten Prädiktor zu entwickeln, um falsch-negative Ergebnisse zu minimieren.
Die Schlaganfallvorhersage ist ein kritisches Gesundheitsproblem, das mehrere interne und externe Faktoren umfasst:
- Externe Faktoren: Familienstand, Berufstyp, Wohnumgebung usw.
- Interne Faktoren: Herzerkrankungsgeschichte, BMI, Alter, Blutzuckerspiegel usw.
- Auswirkungen auf die öffentliche Gesundheit: Schlaganfall ist die zweithäufigste Ursache für Todesfälle und Behinderungen weltweit
- Präventionswert: Frühe Risikobewertung kann Lebensstiländerungen motivieren
- Klinische Anwendung: Echtzeitrisikobewertung kann in routinemäßige Untersuchungen integriert werden
- Mangel an umfassenden Vorhersagemodellen, die klinische und soziale Merkmale effektiv kombinieren
- Im medizinischen Kontext wurde die Schädlichkeit falsch-negativer Ergebnisse nicht ausreichend beachtet
- Begrenzte Vergleichsstudien verschiedener maschineller Lernmethoden bei der Schlaganfallvorhersage
- Multi-Modell-Vergleichsrahmen: Systematischer Vergleich der Leistung von logistischer Regression, dichten neuronalen Netzen und Faltungsneuronalen Netzen bei der Schlaganfallvorhersage
- Medizinisch orientierte Bewertungsstrategie: Fokus auf Minimierung falsch-negativer Ergebnisse, entsprechend den praktischen Anforderungen medizinischer Szenarien
- Umfassende Merkmalsanalyse: Integration klinischer Indikatoren und sozialer Faktoren für eine ganzheitliche Risikobewertung
- Praktische Multi-Modell-Systemempfehlungen: Vorschlag einer gestuften Vorhersage-Pipeline, die die Vorteile mehrerer Modelle kombiniert
- Eingabe: Patientendaten mit 10 Merkmalen (Alter, Geschlecht, Bluthochdruck, Herzerkrankung, Familienstand, Berufstyp, Wohntyp, durchschnittlicher Blutzuckerspiegel, BMI, Raucherstatus)
- Ausgabe: Binäres Klassifizierungsergebnis (0: kein Schlaganfall, 1: Schlaganfall vorhanden)
- Einschränkungen: Minimierung falsch-negativer Ergebnisse, Ausgleich zwischen Präzision und Recall
- Vorverarbeitung: StandardScaler für Merkmalsnormalisierung, Label Encoder für kategorische Variablen
- Regularisierung: L2-Regularisierung zur Vermeidung von Überanpassung
- Optimierung: Maximale Iterationen von 10.000 zur Gewährleistung der Konvergenz
- Entscheidungsgrenze: Wahrscheinlichkeitsschwelle von 0,5 (anpassbar)
Dichtes neuronales Netz (DNN):
- Eingabeschicht: 10 Merkmale
- Verborgene Schichten: Mit Batch Normalization und Dropout
- Aktivierungsfunktion: ReLU
- Ausgabeschicht: Einzelnes Neuron mit Sigmoid-Aktivierung
Faltungsneuronales Netz (CNN):
- Ähnliche Architektur, aber mit Faltungsschichten zur Merkmalverarbeitung
- Enthält Pooling-Schichten und vollständig verbundene Schichten
Trainingsparameter:
- Verlustfunktion: Cross Entropy Loss (geeignet für Klassenunausgeglichenheit)
- Optimierer: Adam (adaptive Lernrate)
- Trainings-Epochen: 400
- Regularisierung: Dropout + Batch Normalization
- Multi-Architektur-Vergleich: Erstmaliger systematischer Vergleich der CNN- und DNN-Leistung bei der Schlaganfallvorhersage mit Tabellendaten
- Medizinisch orientiertes Design: Verwendung gewichteter Verlustfunktionen zur Behandlung von Klassenunausgeglichenheit
- Merkmalswichtigkeitsanalyse: Analyse biologischer Faktoren durch logistische Regressionskoeffizienten
- Statistische Robustheitsprüfung: Bootstrap-Resampling zur Berechnung von 95%-Konfidenzintervallen
- Quelle: Kaggle-Schlaganfall-Vorhersagedatensatz
- Umfang: Etwa 5.000 Proben
- Klassenverteilung: Stark unausgeglichen (nur 5-6% Schlaganfälle)
- Aufteilung: 80% Trainingssatz, 20% Testsatz
- Merkmale: 10 klinische und soziale Merkmale
- Genauigkeit (Accuracy): Gesamtkorrektheit
- Recall (Sensitivität): Fähigkeit, echte Schlaganfälle zu erkennen (Hauptfokus)
- Präzision (Precision): Genauigkeit der Schlaganfall-Vorhersagen
- F1-Score: Harmonisches Mittel aus Präzision und Recall
- AUC-ROC: Diskriminierungsfähigkeit bei verschiedenen Schwellwerten
- Verwechslungsmatrix: Detaillierte Klassifizierungsfehleranalyse
- Logistische Regression (Sklearn-Implementierung)
- Dichtes neuronales Netz (PyTorch-Implementierung)
- Faltungsneuronales Netz (PyTorch-Implementierung)
- Framework: PyTorch (neuronale Netze), Sklearn (logistische Regression)
- Hardware: Standardrechenumgebung
- Reproduzierbarkeit: Feste Zufallssamen, Open-Source-Code
| Modell | Genauigkeit | Recall | Präzision | F1-Score |
|---|
| Logistische Regression | 74,95% | 75,81% | 16,31% | - |
| Dichtes neuronales Netz | 86,50% | 43,55% | 20,77% | - |
| Faltungsneuronales Netz | 78,67% | 53,23% | - | - |
- Kompromiss zwischen Genauigkeit und Recall:
- Dichtes neuronales Netz erreicht höchste Genauigkeit (86,50%), aber niedrigerer Recall (43,55%)
- Logistische Regression hat höchsten Recall (75,81%), aber niedrigere Präzision (16,31%)
- CNN erreicht Ausgleich zwischen beiden
- Merkmalswichtigkeitsanalyse:
- Alter ist der wichtigste Prädiktor (entspricht medizinischem Wissen)
- BMI-Wichtigkeit niedriger als erwartet (widerspricht bestehender Forschung)
- Trainingsdynamik:
- CNN konvergiert nach 50 Epochen langsam
- DNN zeigt kontinuierliche Verbesserung über alle 400 Epochen
- Keine offensichtliche Überanpassung
Bootstrap-Resampling (1.000 Iterationen) zur Berechnung von 95%-Konfidenzintervallen:
- DNN-Genauigkeit: 86,50% 84,32%, 88,68%
- DNN-Recall: 43,55% 39,87%, 47,23%
- Logistische Regression Genauigkeit: 74,95% 72,63%, 77,27%
- Logistische Regression Recall: 75,81% 72,14%, 79,48%
Das Papier zitiert mehrere relevante Studien:
- Shao et al. (2024): Betonung der Bedeutung von BMI und Alter als biologische Prädiktoren
- Gupta et al. (2025): Neuronale Netzwerk-basierte Schlaganfall-Vorhersagemodelle
- Zhang et al. (2022): Anwendung von Mehrschicht-Perceptrons bei der Schlaganfallvorhersage
Vorteile dieser Studie gegenüber bestehenden Arbeiten:
- Systematischer Vergleich mehrerer maschineller Lernmethoden
- Fokus auf Minimierung falsch-negativer Ergebnisse
- Umfassende Analyse, die klinische und soziale Merkmale kombiniert
- Modellwahl hängt vom Anwendungsszenario ab:
- Logistische Regression: Geeignet für Initialscreening (hoher Recall, starke Interpretierbarkeit)
- Dichtes neuronales Netz: Geeignet für präzise Bewertung (hohe Genauigkeit, niedrige falsch-positive Ergebnisse)
- CNN: Ausgewogene Leistung, geeignet als Validierungswerkzeug
- Multi-Modell-Systemempfehlung:
- Erste Phase: Logistische Regression für Initialscreening
- Zweite Phase: DNN für präzise Bewertung von Hochrisikopatienten
- Dritte Phase: CNN für Validierung und Ausgleich
- Datenunausgeglichenheit: Nur 5-6% positive Fälle begrenzen die Lernfähigkeit des Modells
- Anomalien bei Merkmalswichtigkeit: Niedrigere BMI-Wichtigkeit als erwartet kann die Vorhersagegenauigkeit beeinflussen
- Verallgemeinerungsfähigkeit: Ein einzelner Datensatz kann die Universalität des Modells begrenzen
- Stichprobengröße: 5.000 Proben sind relativ klein, besonders bei positiven Fällen
- Datenerweiterung: Sammlung mehr echter Schlaganfall-Patientendaten zur Linderung von Klassenunausgeglichenheit
- Merkmalstechnik: Neubewertung und Optimierung der Merkmalsauswahlstrategie
- Modellintegration: Entwicklung ausgefeilteren Multi-Modell-Fusionsmethoden
- Klinische Validierung: Validierung der Modellleistung in echten medizinischen Umgebungen
- Praktische Ausrichtung: Klarer Fokus auf die praktische Anforderung der Minimierung falsch-negativer Ergebnisse in medizinischen Szenarien
- Umfassende Methodik: Systematischer Vergleich traditioneller maschineller Lernmethoden und Deep Learning
- Statistische Strenge: Verwendung von Bootstrap-Methoden zur Validierung der Robustheit der Ergebnisse
- Reproduzierbarkeit: Vollständiger Code und Daten mit MIT-Open-Source-Lizenz
- Klinische Relevanz: Integration anerkannter Risikofaktoren aus dem medizinischen Bereich
- Datenqualität: Schwerwiegende Klassenunausgeglichenheit nicht ausreichend gelöst
- Modelltiefe: Relativ einfache neuronale Netzwerk-Architektur, nicht vollständige Erkundung des Deep-Learning-Potenzials
- Unzureichende Merkmalstechnik: Anomale BMI-Wichtigkeit deutet auf mögliche Probleme bei der Merkmalverarbeitung hin
- Bewertungslimitierungen: Fehlender Vergleich mit bestehenden klinischen Risikobewertungswerkzeugen
- Experimenteller Umfang: Einzelner Datensatz, fehlende datensatzübergreifende Validierung
- Akademischer Beitrag: Bietet praktischen Multi-Modell-Vergleichsrahmen für medizinische KI
- Klinischer Wert: Vorgeschlagenes gestuftes Vorhersagesystem hat praktisches Anwendungspotenzial
- Methodologische Bedeutung: Unterstreicht die Wichtigkeit der Kontrolle falsch-negativer Ergebnisse in medizinischer KI
- Skalierbarkeit: Methode kann auf andere medizinische Vorhersageaufgaben übertragen werden
- Primärmedizinische Versorgung: Logistisches Regressionsmodell geeignet für Screening in Gemeindekliniken
- Fachkrankenhäuser: Dichtes neuronales Netz geeignet für präzise Risikobewertung
- Gesundheitsmanagement: Kann in persönliche Gesundheitsüberwachungsanwendungen integriert werden
- Klinische Forschung: Bietet Werkzeuge für Schlaganfall-Risikofaktor-Forschung
- CDC. Preventing stroke deaths. https://www.cdc.gov/vitalsigns/pdf/2017-09-vitalsigns.pdf
- Shao, Y., et al. (2024). Link between triglyceride-glucose-body mass index and future stroke risk in middle-aged and elderly Chinese. Cardiovascular Diabetology.
- Gupta, A., et al. (2025). Predicting stroke risk: An effective stroke prediction model based on neural networks. Journal of Neurorestoratology.
Gesamtbewertung: Diese Studie bietet eine wertvolle Multi-Modell-Vergleichsanalyse für das wichtige medizinische Problem der Schlaganfallvorhersage, wobei die Betonung der Kontrolle falsch-negativer Ergebnisse die praktischen Anforderungen medizinischer KI widerspiegelt. Trotz Einschränkungen wie Datenunausgeglichenheit hat die vorgeschlagene Multi-Modell-Systemarchitektur praktischen Anwendungswert und bietet einen guten Referenzrahmen für ähnliche Forschungen im Bereich medizinische KI.