2025-11-22T01:16:16.023348

Stroke Prediction using Clinical and Social Features in Machine Learning

Chadha

Every year in the United States, 800,000 individuals suffer a stroke - one person every 40 seconds, with a death occurring every four minutes. While individual factors vary, certain predictors are more prevalent in determining stroke risk. As strokes are the second leading cause of death and disability worldwide, predicting stroke likelihood based on lifestyle factors is crucial. Showing individuals their stroke risk could motivate lifestyle changes, and machine learning offers solutions to this prediction challenge. Neural networks excel at predicting outcomes based on training features like lifestyle factors, however, they're not the only option. Logistic regression models can also effectively compute the likelihood of binary outcomes based on independent variables, making them well-suited for stroke prediction. This analysis will compare both neural networks (dense and convolutional) and logistic regression models for stroke prediction, examining their pros, cons, and differences to develop the most effective predictor that minimizes false negatives.

academic

Schlaganfallvorhersage mittels klinischer und sozialer Merkmale im maschinellen Lernen

Grundinformationen

Papier-ID: 2501.00048
Titel: Stroke Prediction using Clinical and Social Features in Machine Learning
Autor: Aidan Chadha (Virginia Tech)
Klassifizierung: cs.LG cs.AI
Veröffentlichungszeit/Konferenz: Preprint 2025
Papierlink: https://arxiv.org/abs/2501.00048
Codelink: https://github.com/Aidan7757/stroke_prediction_using_clinical_social_features

Zusammenfassung

Jährlich erleiden 800.000 Menschen in den USA einen Schlaganfall, alle 40 Sekunden tritt ein Schlaganfall auf, und alle 4 Minuten stirbt eine Person an einem Schlaganfall. Als zweithäufigste Ursache für Todesfälle und Behinderungen weltweit ist die Vorhersage der Schlaganfallwahrscheinlichkeit auf Grundlage von Lebensstilfaktoren von entscheidender Bedeutung. Diese Studie vergleicht die Leistung von neuronalen Netzen (dicht und konvolutiv) mit logistischen Regressionsmodellen bei der Schlaganfallvorhersage mit dem Ziel, den wirksamsten Prädiktor zu entwickeln, um falsch-negative Ergebnisse zu minimieren.

Forschungshintergrund und Motivation

Problemdefinition

Die Schlaganfallvorhersage ist ein kritisches Gesundheitsproblem, das mehrere interne und externe Faktoren umfasst:

Externe Faktoren: Familienstand, Berufstyp, Wohnumgebung usw.
Interne Faktoren: Herzerkrankungsgeschichte, BMI, Alter, Blutzuckerspiegel usw.

Bedeutung

Auswirkungen auf die öffentliche Gesundheit: Schlaganfall ist die zweithäufigste Ursache für Todesfälle und Behinderungen weltweit
Präventionswert: Frühe Risikobewertung kann Lebensstiländerungen motivieren
Klinische Anwendung: Echtzeitrisikobewertung kann in routinemäßige Untersuchungen integriert werden

Bestehende Einschränkungen

Mangel an umfassenden Vorhersagemodellen, die klinische und soziale Merkmale effektiv kombinieren
Im medizinischen Kontext wurde die Schädlichkeit falsch-negativer Ergebnisse nicht ausreichend beachtet
Begrenzte Vergleichsstudien verschiedener maschineller Lernmethoden bei der Schlaganfallvorhersage

Kernbeiträge

Multi-Modell-Vergleichsrahmen: Systematischer Vergleich der Leistung von logistischer Regression, dichten neuronalen Netzen und Faltungsneuronalen Netzen bei der Schlaganfallvorhersage
Medizinisch orientierte Bewertungsstrategie: Fokus auf Minimierung falsch-negativer Ergebnisse, entsprechend den praktischen Anforderungen medizinischer Szenarien
Umfassende Merkmalsanalyse: Integration klinischer Indikatoren und sozialer Faktoren für eine ganzheitliche Risikobewertung
Praktische Multi-Modell-Systemempfehlungen: Vorschlag einer gestuften Vorhersage-Pipeline, die die Vorteile mehrerer Modelle kombiniert

Methodische Details

Aufgabendefinition

Eingabe: Patientendaten mit 10 Merkmalen (Alter, Geschlecht, Bluthochdruck, Herzerkrankung, Familienstand, Berufstyp, Wohntyp, durchschnittlicher Blutzuckerspiegel, BMI, Raucherstatus)
Ausgabe: Binäres Klassifizierungsergebnis (0: kein Schlaganfall, 1: Schlaganfall vorhanden)
Einschränkungen: Minimierung falsch-negativer Ergebnisse, Ausgleich zwischen Präzision und Recall

Modellarchitekturen

1. Logistische Regressionsmodell

Vorverarbeitung: StandardScaler für Merkmalsnormalisierung, Label Encoder für kategorische Variablen
Regularisierung: L2-Regularisierung zur Vermeidung von Überanpassung
Optimierung: Maximale Iterationen von 10.000 zur Gewährleistung der Konvergenz
Entscheidungsgrenze: Wahrscheinlichkeitsschwelle von 0,5 (anpassbar)

2. Neuronale Netzwerk-Modelle

Dichtes neuronales Netz (DNN):

Eingabeschicht: 10 Merkmale
Verborgene Schichten: Mit Batch Normalization und Dropout
Aktivierungsfunktion: ReLU
Ausgabeschicht: Einzelnes Neuron mit Sigmoid-Aktivierung

Faltungsneuronales Netz (CNN):

Ähnliche Architektur, aber mit Faltungsschichten zur Merkmalverarbeitung
Enthält Pooling-Schichten und vollständig verbundene Schichten

Trainingsparameter:

Verlustfunktion: Cross Entropy Loss (geeignet für Klassenunausgeglichenheit)
Optimierer: Adam (adaptive Lernrate)
Trainings-Epochen: 400
Regularisierung: Dropout + Batch Normalization

Technische Innovationen

Multi-Architektur-Vergleich: Erstmaliger systematischer Vergleich der CNN- und DNN-Leistung bei der Schlaganfallvorhersage mit Tabellendaten
Medizinisch orientiertes Design: Verwendung gewichteter Verlustfunktionen zur Behandlung von Klassenunausgeglichenheit
Merkmalswichtigkeitsanalyse: Analyse biologischer Faktoren durch logistische Regressionskoeffizienten
Statistische Robustheitsprüfung: Bootstrap-Resampling zur Berechnung von 95%-Konfidenzintervallen

Experimentelle Einrichtung

Datensatz

Quelle: Kaggle-Schlaganfall-Vorhersagedatensatz
Umfang: Etwa 5.000 Proben
Klassenverteilung: Stark unausgeglichen (nur 5-6% Schlaganfälle)
Aufteilung: 80% Trainingssatz, 20% Testsatz
Merkmale: 10 klinische und soziale Merkmale

Bewertungsmetriken

Genauigkeit (Accuracy): Gesamtkorrektheit
Recall (Sensitivität): Fähigkeit, echte Schlaganfälle zu erkennen (Hauptfokus)
Präzision (Precision): Genauigkeit der Schlaganfall-Vorhersagen
F1-Score: Harmonisches Mittel aus Präzision und Recall
AUC-ROC: Diskriminierungsfähigkeit bei verschiedenen Schwellwerten
Verwechslungsmatrix: Detaillierte Klassifizierungsfehleranalyse

Vergleichsmethoden

Logistische Regression (Sklearn-Implementierung)
Dichtes neuronales Netz (PyTorch-Implementierung)
Faltungsneuronales Netz (PyTorch-Implementierung)

Implementierungsdetails

Framework: PyTorch (neuronale Netze), Sklearn (logistische Regression)
Hardware: Standardrechenumgebung
Reproduzierbarkeit: Feste Zufallssamen, Open-Source-Code

Experimentelle Ergebnisse

Hauptergebnisse

Modell	Genauigkeit	Recall	Präzision	F1-Score
Logistische Regression	74,95%	75,81%	16,31%	-
Dichtes neuronales Netz	86,50%	43,55%	20,77%	-
Faltungsneuronales Netz	78,67%	53,23%	-	-

Wichtigste Erkenntnisse

Kompromiss zwischen Genauigkeit und Recall:
- Dichtes neuronales Netz erreicht höchste Genauigkeit (86,50%), aber niedrigerer Recall (43,55%)
- Logistische Regression hat höchsten Recall (75,81%), aber niedrigere Präzision (16,31%)
- CNN erreicht Ausgleich zwischen beiden
Merkmalswichtigkeitsanalyse:
- Alter ist der wichtigste Prädiktor (entspricht medizinischem Wissen)
- BMI-Wichtigkeit niedriger als erwartet (widerspricht bestehender Forschung)
Trainingsdynamik:
- CNN konvergiert nach 50 Epochen langsam
- DNN zeigt kontinuierliche Verbesserung über alle 400 Epochen
- Keine offensichtliche Überanpassung

Statistische Signifikanz

Bootstrap-Resampling (1.000 Iterationen) zur Berechnung von 95%-Konfidenzintervallen:

DNN-Genauigkeit: 86,50% 84,32%, 88,68%
DNN-Recall: 43,55% 39,87%, 47,23%
Logistische Regression Genauigkeit: 74,95% 72,63%, 77,27%
Logistische Regression Recall: 75,81% 72,14%, 79,48%

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Modellwahl hängt vom Anwendungsszenario ab:
- Logistische Regression: Geeignet für Initialscreening (hoher Recall, starke Interpretierbarkeit)
- Dichtes neuronales Netz: Geeignet für präzise Bewertung (hohe Genauigkeit, niedrige falsch-positive Ergebnisse)
- CNN: Ausgewogene Leistung, geeignet als Validierungswerkzeug
Multi-Modell-Systemempfehlung:
- Erste Phase: Logistische Regression für Initialscreening
- Zweite Phase: DNN für präzise Bewertung von Hochrisikopatienten
- Dritte Phase: CNN für Validierung und Ausgleich

Einschränkungen

Datenunausgeglichenheit: Nur 5-6% positive Fälle begrenzen die Lernfähigkeit des Modells
Anomalien bei Merkmalswichtigkeit: Niedrigere BMI-Wichtigkeit als erwartet kann die Vorhersagegenauigkeit beeinflussen
Verallgemeinerungsfähigkeit: Ein einzelner Datensatz kann die Universalität des Modells begrenzen
Stichprobengröße: 5.000 Proben sind relativ klein, besonders bei positiven Fällen

Zukünftige Richtungen

Datenerweiterung: Sammlung mehr echter Schlaganfall-Patientendaten zur Linderung von Klassenunausgeglichenheit
Merkmalstechnik: Neubewertung und Optimierung der Merkmalsauswahlstrategie
Modellintegration: Entwicklung ausgefeilteren Multi-Modell-Fusionsmethoden
Klinische Validierung: Validierung der Modellleistung in echten medizinischen Umgebungen

Tiefgreifende Bewertung

Stärken

Praktische Ausrichtung: Klarer Fokus auf die praktische Anforderung der Minimierung falsch-negativer Ergebnisse in medizinischen Szenarien
Umfassende Methodik: Systematischer Vergleich traditioneller maschineller Lernmethoden und Deep Learning
Statistische Strenge: Verwendung von Bootstrap-Methoden zur Validierung der Robustheit der Ergebnisse
Reproduzierbarkeit: Vollständiger Code und Daten mit MIT-Open-Source-Lizenz
Klinische Relevanz: Integration anerkannter Risikofaktoren aus dem medizinischen Bereich

Schwächen

Datenqualität: Schwerwiegende Klassenunausgeglichenheit nicht ausreichend gelöst
Modelltiefe: Relativ einfache neuronale Netzwerk-Architektur, nicht vollständige Erkundung des Deep-Learning-Potenzials
Unzureichende Merkmalstechnik: Anomale BMI-Wichtigkeit deutet auf mögliche Probleme bei der Merkmalverarbeitung hin
Bewertungslimitierungen: Fehlender Vergleich mit bestehenden klinischen Risikobewertungswerkzeugen
Experimenteller Umfang: Einzelner Datensatz, fehlende datensatzübergreifende Validierung

Auswirkungen

Akademischer Beitrag: Bietet praktischen Multi-Modell-Vergleichsrahmen für medizinische KI
Klinischer Wert: Vorgeschlagenes gestuftes Vorhersagesystem hat praktisches Anwendungspotenzial
Methodologische Bedeutung: Unterstreicht die Wichtigkeit der Kontrolle falsch-negativer Ergebnisse in medizinischer KI
Skalierbarkeit: Methode kann auf andere medizinische Vorhersageaufgaben übertragen werden

Anwendungsszenarien

Primärmedizinische Versorgung: Logistisches Regressionsmodell geeignet für Screening in Gemeindekliniken
Fachkrankenhäuser: Dichtes neuronales Netz geeignet für präzise Risikobewertung
Gesundheitsmanagement: Kann in persönliche Gesundheitsüberwachungsanwendungen integriert werden
Klinische Forschung: Bietet Werkzeuge für Schlaganfall-Risikofaktor-Forschung

Literaturverzeichnis

CDC. Preventing stroke deaths. https://www.cdc.gov/vitalsigns/pdf/2017-09-vitalsigns.pdf
Shao, Y., et al. (2024). Link between triglyceride-glucose-body mass index and future stroke risk in middle-aged and elderly Chinese. Cardiovascular Diabetology.
Gupta, A., et al. (2025). Predicting stroke risk: An effective stroke prediction model based on neural networks. Journal of Neurorestoratology.

Gesamtbewertung: Diese Studie bietet eine wertvolle Multi-Modell-Vergleichsanalyse für das wichtige medizinische Problem der Schlaganfallvorhersage, wobei die Betonung der Kontrolle falsch-negativer Ergebnisse die praktischen Anforderungen medizinischer KI widerspiegelt. Trotz Einschränkungen wie Datenunausgeglichenheit hat die vorgeschlagene Multi-Modell-Systemarchitektur praktischen Anwendungswert und bietet einen guten Referenzrahmen für ähnliche Forschungen im Bereich medizinische KI.