2025-11-13T19:40:11.201973

A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials

Robertson, Jaki

A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.

academic

Ein Vergleich von Ansätzen zur Einbeziehung von Patienten ausgewählten und Patienten bewerteten Ergebnissen in klinischen Studien

Grundinformationen

Papier-ID: 2510.11578
Titel: A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials
Autoren: David S. Robertson, Thomas Jaki
Klassifizierung: stat.ME (Statistische Methodik)
Veröffentlichungsdatum: 13. Oktober 2025 (arXiv Preprint)
Papierlink: https://arxiv.org/abs/2510.11578

Zusammenfassung

Ein Schlüsselaspekt der patientenorientierten Arzneimittelentwicklung ist die Identifizierung und Messung von Ergebnissen, die für Patienten wichtig sind, in klinischen Studien. Viele Krankheiten beeinflussen mehrere Symptombereiche, und Konsensmethoden zur Bestimmung der relativen Bedeutung relevanter multipler Ergebnisse ignorieren die Heterogenität individueller Patientenpräferenzen. Von Patienten ausgewählte Ergebnisse bieten eine Methode zur Einbeziehung individueller Patientenpräferenzen, wie in der kürzlich von der FDA veröffentlichten Anleitung zur Behandlung von Migräne vorgeschlagen, wobei jeder Patient zusätzlich zum Schmerz das störendste migränebezogene Symptom auswählen soll. Kürzlich wurden auch von Patienten bewertete Ergebnisse vorgeschlagen, die eine vollständige Rangfolge der relativen Bedeutung aller Ergebnisse berücksichtigen und durch zusammengesetzte DOOR-Endpunkte (Wünschbarkeit der Ergebnispriorisierung) bewertet werden können. Dieses Papier vergleicht die Vor- und Nachteile der Verwendung von Patienten ausgewählten Ergebnissen gegenüber Patienten bewerteten Ergebnissen im Kontext einer zweiarmigen randomisierten kontrollierten Studie zur Multiplen Sklerose, vergleicht Wirksamkeit und Typ-I-Fehlerrate durch Simulation und erörtert andere wichtige Überlegungen bei der Verwendung beider Methoden.

Forschungshintergrund und Motivation

Bedeutung des Problems

Bedarf an patientenorientierter Arzneimittelentwicklung: Die traditionelle Auswahl von Studienendpunkten basiert häufig auf dem Konsens von Forschern und Regulierungsbehörden und ignoriert die Heterogenität individueller Patientenpräferenzen
Multidimensionalität komplexer Krankheiten: Komplexe Krankheiten wie Multiple Sklerose und rheumatoide Arthritis beeinflussen mehrere Symptombereiche, und verschiedene Patienten legen unterschiedliches Gewicht auf Verbesserungen verschiedener Symptome
Regulatorische Förderung: Die FDA-Anleitung zur Migränemedikamentenentwicklung von 2018 erkannte erstmals offiziell die Verwendung von Patienten ausgewählten Ergebnissen an

Einschränkungen bestehender Methoden

Traditionelle Konsensmethoden: Ignorieren die Heterogenität der Patientenpräferenzen und können möglicherweise nicht die Ergebnisse widerspiegeln, die Patienten tatsächlich interessieren
Mehrere gemeinsame primäre Endpunkte: Erfordern Wirksamkeitsnachweise bei allen Ergebnissen, was möglicherweise zu streng ist
Mangelnde Individualisierung: Nutzen Informationen über individuelle Patientenpräferenzen nicht vollständig, um das Studiendesign und die Analyse zu optimieren

Forschungsmotivation

Dieses Papier zielt darauf ab, zwei Methoden zur Einbeziehung von Patientenpräferenzen systematisch zu vergleichen: von Patienten ausgewählte Ergebnisse (nur die wichtigsten Ergebnisse berücksichtigung) und von Patienten bewertete Ergebnisse (vollständige Wichtigkeitsrangfolge berücksichtigung), um methodische Richtlinien für das Studiendesign bereitzustellen.

Kernbeiträge

Analysemethoden für von Patienten ausgewählte Ergebnisse entwickelt: Zwei statistische Methoden zur Analyse von Patienten ausgewählten Ergebnissen entwickelt (Mittelwertvergleichsmethode und Proportionsprüfung)
Systematischer Vergleich der statistischen Leistung verschiedener Methoden: Durch Simulationsstudien wurden Wirksamkeit und Typ-I-Fehlerrate von Patienten ausgewählten Ergebnissen, Patienten bewerteten Ergebnissen (zusammengesetztes DOOR) und traditioneller univariater Analyse verglichen
Praktische Richtlinien für die Methodenauswahl bereitgestellt: Basierend auf Faktoren wie Verteilung der Patientenpräferenzen und Korrelation zwischen Ergebnissen wurden konkrete Empfehlungen für die Methodenauswahl gegeben
Methodologie patientenorientierter klinischer Studien erweitert: Erweiterung von binären Ergebnissen in der Migräne auf kontinuierliche Ergebnisse, Grundlage für breitere Anwendung geschaffen

Methodische Details

Aufgabendefinition

In einer zweiarmigen randomisierten kontrollierten Studie werden die Auswirkungen der experimentellen Gruppe (k=1) und der Kontrollgruppe (k=0) auf mehrere Ergebnisse verglichen, wobei jeder Patient m kontinuierliche Ergebnisse Yi = (Yi,1, ..., Yi,m) und entsprechende Präferenzinformationen hat.

Methode der von Patienten ausgewählten Ergebnisse

1. Mittelwert-Patienten-Auswahlmethode

Für das von Patient i ausgewählte Ergebnis si, angenommen Yi,j ~ N(μai,j, σ²ai), unter Verwendung des Welch-t-Tests:

t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)

wobei Ȳk = (1/nk)Σ1{ai = k}Yi,si

Schlüsselbedingungen: Um die korrekte Verteilung unter der Nullhypothese sicherzustellen, müssen folgende Bedingungen erfüllt sein:

Bedingung 1: n1,j/n1 = n0,j/n0 (durch schichtweise Randomisierung nach ausgewähltem Ergebnis erreicht)
Bedingung 2: μj = 0 (wie bei Placebo-Kontrolle)

2. Proportionsprüfungsmethode

Definieren Sie ein binäres Ergebnis: Y*i = 1{Yi,si > λsi}, wobei λsi die minimal klinisch wichtige Differenz (MCID) ist Verwenden Sie den Wald-Test, um die Proportionen zwischen den beiden Gruppen zu vergleichen, die klinisch bedeutsame Verbesserungen erreichen.

Methode der von Patienten bewerteten Ergebnisse

Zusammengesetzte DOOR-Methode

Für jedes Patientenpaar (i0, i1) definieren Sie den DOOR-Indikator für einzelne Ergebnisse:

Zi0,i1(j) = {
  1    wenn Yi1,j - Yi0,j > MCIDj
  0    wenn Yi1,j - Yi0,j < MCIDj  
  0.5  wenn |Yi1,j - Yi0,j| ≤ MCIDj
}

Durch einen iterativen Algorithmus wird die Patientenbewertungshierarchie berücksichtigt, von der kleinsten gemeinsamen Rangfolgemenge bis zur größten Menge, um das zusammengesetzte DOOR zu bestimmen.

Schätzer: θ̂ = (1/n0n1)ΣΣZi0,i1

Gewichtete Gewinnwahrscheinlichkeitsmethode (WWP)

Schichten Sie nach dem bevorzugten Ergebnis des Patienten, berechnen Sie die Gewinnwahrscheinlichkeit jeder Schicht und gewichten Sie dann den Durchschnitt: θ̂WT = Σp̂jθ̂j

wobei p̂j der Anteil der Patienten ist, die Ergebnis j als am wichtigsten auswählen.

Technische Innovationspunkte

Theoretische Grundlagen der schichtweisen Randomisierung: Klärung der theoretischen Bedingungen für die Analyse von Patienten ausgewählten Ergebnissen
Erweiterung auf kontinuierliche Ergebnisse: Erweiterung von Patienten ausgewählten Ergebnissen von binären auf kontinuierliche Ergebnisse
Systematischer Vergleichsrahmen: Aufbau eines statistischen Rahmens für faire Vergleiche zwischen verschiedenen Methoden

Experimentelle Einrichtung

Simulationsdesign

Basierend auf dem Design einer klinischen Studie zur Multiplen Sklerose mit drei Ergebnissen: Müdigkeit, Schmerz, Depression.

Datengenerierungsmechanismus

Stichprobengröße: 60 Patienten, 1:1 Randomisierung
Ergebnisverteilung: Trivariate Normalverteilung, Kovarianzmatrix berücksichtigt niedrige (0,25), mittlere (0,55) und hohe (0,75) Korrelation
Patientenpräferenzen:
- Ungleiche Präferenzen: (p123, p132, p213, p231, p312, p321) = (0,42, 0,17, 0,24, 0,05, 0,08, 0,04)
- Gleiche Präferenzen: Jede Rangfolge 1/6

Simulationsszenarien

8 Szenarien mit verschiedenen Behandlungseffektmustern:

S1: Kein Effekt (Nullhypothese)
S2: Gleichmäßige Verbesserung aller Ergebnisse
S3: Nur Müdigkeitsverbesserung (59% der Patienten bevorzugt)
S4: Nur Depressionverbesserung (12% der Patienten bevorzugt)
S5-S8: Verschiedene Kombinationseffekte und Wechselwirkungen

Bewertungsindikatoren

Typ-I-Fehlerrate: Ablehnungsrate in Szenario 1
Statistische Wirksamkeit: Ablehnungsrate in Szenarien 2-8
Monte-Carlo-Standardfehler: <0,5% (basierend auf 10⁴ Wiederholungen)

Experimentelle Ergebnisse

Hauptergebnisse

Vergleich der Wirksamkeit unter ungleichen Präferenzen

Methode	S1	S2	S3	S4	S5	S6	S7	S8
Zusammengesetztes DOOR	6,0	99,8	59,9	26,4	76,6	80,9	59,2	1,8
WWP	6,7	98,0	65,6	7,9	71,2	78,4	25,5	0,4
Mittelwert-Patientenauswahl	4,8	98,7	68,5	8,8	74,8	81,6	28,0	0,4
Proportionsprüfung	2,8	91,4	54,4	8,0	59,6	66,2	23,0	4,0

Schlüsselfunde

Kontrolle der Typ-I-Fehlerrate: Die Mittelwert-Patienten-Auswahlmethode kontrolliert die Typ-I-Fehlerrate gut auf dem 5%-Niveau
Wirksamkeitsvorteilssituationen: Wenn das von den meisten Patienten bevorzugte Ergebnis eine große Behandlungswirkung hat (z. B. S3), ist die Wirksamkeit der Patienten-Auswahlmethode vergleichbar mit dem zusammengesetzten DOOR
Korrelationseinfluss: Hohe Korrelation reduziert die Wirksamkeit des zusammengesetzten DOOR, hat aber weniger Auswirkungen auf die Patienten-Auswahlmethode
Gleiche vs. ungleiche Präferenzen: Unter gleichen Präferenzen ist der Vorteil des zusammengesetzten DOOR ausgeprägter

Ablationsstudien

Auswirkung der Korrelationsstruktur

Niedrige Korrelation: Wirksamkeit des zusammengesetzten DOOR verbessert sich, Patienten-Auswahlmethode bleibt grundsätzlich unverändert
Hohe Korrelation: Wirksamkeit des zusammengesetzten DOOR sinkt, Patienten-Auswahlmethode bleibt stabil

Auswirkung von Grenzeffekten

Mit MCID=0:

Wirksamkeit des zusammengesetzten DOOR unter ungleichen Präferenzen deutlich verbessert
WWP und Proportionsprüfung zeigen leichte Wirksamkeitsabnahme

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Bedingte Vorteile: Die Patienten-Auswahlmethode ist funktional äquivalent zum zusammengesetzten DOOR, wenn die von den meisten Patienten bevorzugten Ergebnisse eine Behandlungswirkung zeigen und die Ergebnisse mittelhoch korreliert sind
Vereinfachungsvorteile: Die Patienten-Auswahl ist leichter umzusetzen und erfordert nur die Erfassung der wichtigsten Ergebnisse statt der vollständigen Rangfolge
Regulatorische Akzeptanz: Die Patienten-Auswahl hat bereits regulatorische Präzedenzfälle und ist leichter zu genehmigen

Einschränkungen

Anforderungen an theoretische Bedingungen: Erfordert schichtweise Randomisierung oder spezifische Nullhypothesenbedingungen
Unzureichende Informationsnutzung: Kann wichtige Behandlungseffekte bei nicht bevorzugten Ergebnissen übersehen
Parametrische Methodenbeschränkungen: Aktuelle Methoden setzen Normalverteilung voraus, Erweiterung auf andere Verteilungen erforderlich

Zukünftige Richtungen

Verbundene Modellierung: Entwicklung von Strategien für gemeinsame Analyse mit Informationsausleihe
Nichtparametrische Methoden: Erweiterung auf Analysemethoden für verschiedene Ergebnistypen
Einbeziehung von Kovariaten: Berücksichtigung des Einflusses von Patientenmerkmalen auf Präferenzen und Ergebnisse
Kontinuierliche Präferenzgewichtungen: Entwicklung von DOOR-Methoden für kontinuierliche Präferenzgewichtungen

Tiefgreifende Bewertung

Stärken

Hoher praktischer Wert: Löst praktische Probleme in klinischen Studien mit klaren Anwendungsszenarien
Methodisch streng: Bietet vollständige theoretische Grundlagen und statistisches Inferenzgerüst
Umfassender Vergleich: Systematischer Vergleich mehrerer Methoden unter Berücksichtigung mehrerer Einflussfaktoren
Angemessenes Simulationsdesign: Basierend auf realen klinischen Studienszenarien mit glaubwürdigen Parametereinstellungen

Mängel

Stichprobengrößenbeschränkung: Simulation basiert auf relativ kleiner Stichprobengröße (60), Leistung bei größeren Stichproben erfordert weitere Überprüfung
Krankheitsspezifität: Hauptsächlich auf Multiple-Sklerose-Szenarien basierend, Anwendbarkeit auf andere Krankheiten erfordert Überprüfung
Annahme der Präferenzstabilität: Geht davon aus, dass Patientenpräferenzen während der Studie unverändert bleiben, was in der Praxis möglicherweise nicht der Fall ist
MCID-Festlegung: Die zusammengesetzte DOOR-Methode hängt von der MCID-Festlegung ab, deren Rationalität umstritten ist

Auswirkungen

Methodische Beiträge: Bietet wichtige statistische Methodenwerkzeuge für patientenorientierte klinische Studien
Regulatorische Bedeutung: Kann die Entwicklung und Aktualisierung zukünftiger regulatorischer Richtlinien beeinflussen
Anwendungsperspektiven: Breites Anwendungspotenzial in klinischen Studien zu komplexen Krankheiten
Theoretischer Wert: Fördert die Anwendung der personalisierten Medizin im Studiendesign

Anwendungsszenarien

Studien zu komplexen Krankheiten: Multiple Sklerose, rheumatoide Arthritis und andere Mehrfach-Symptom-Krankheiten
Große Heterogenität der Patientenpräferenzen: Situationen, in denen verschiedene Patienten unterschiedliche Prioritäten bei Symptomverbesserungen haben
Kontinuierliche Ergebnismessungen: Studien mit standardisierten Skalen (z. B. PROMIS)
Flexible regulatorische Anforderungen: Bereiche, in denen Regulierungsbehörden innovative Endpunktdesigns akzeptieren

Literaturverzeichnis

US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023.
Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022.
van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022.

Dieses Papier leistet einen wichtigen methodischen Beitrag zur patientenorientierten Arzneimittelentwicklung, insbesondere bei der Abwägung zwischen statistischer Effizienz und Individualisierung von Patientenpräferenzen. Trotz einiger Einschränkungen haben sowohl sein praktischer Wert als auch seine theoretische Bedeutung großes Potenzial, die Entwicklung des Studiendesigns in eine patientenzentriertere Richtung zu fördern.