2025-11-13T19:40:11.201973

A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials

Robertson, Jaki
A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.
academic

Ein Vergleich von Ansätzen zur Einbeziehung von Patienten ausgewählten und Patienten bewerteten Ergebnissen in klinischen Studien

Grundinformationen

  • Papier-ID: 2510.11578
  • Titel: A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials
  • Autoren: David S. Robertson, Thomas Jaki
  • Klassifizierung: stat.ME (Statistische Methodik)
  • Veröffentlichungsdatum: 13. Oktober 2025 (arXiv Preprint)
  • Papierlink: https://arxiv.org/abs/2510.11578

Zusammenfassung

Ein Schlüsselaspekt der patientenorientierten Arzneimittelentwicklung ist die Identifizierung und Messung von Ergebnissen, die für Patienten wichtig sind, in klinischen Studien. Viele Krankheiten beeinflussen mehrere Symptombereiche, und Konsensmethoden zur Bestimmung der relativen Bedeutung relevanter multipler Ergebnisse ignorieren die Heterogenität individueller Patientenpräferenzen. Von Patienten ausgewählte Ergebnisse bieten eine Methode zur Einbeziehung individueller Patientenpräferenzen, wie in der kürzlich von der FDA veröffentlichten Anleitung zur Behandlung von Migräne vorgeschlagen, wobei jeder Patient zusätzlich zum Schmerz das störendste migränebezogene Symptom auswählen soll. Kürzlich wurden auch von Patienten bewertete Ergebnisse vorgeschlagen, die eine vollständige Rangfolge der relativen Bedeutung aller Ergebnisse berücksichtigen und durch zusammengesetzte DOOR-Endpunkte (Wünschbarkeit der Ergebnispriorisierung) bewertet werden können. Dieses Papier vergleicht die Vor- und Nachteile der Verwendung von Patienten ausgewählten Ergebnissen gegenüber Patienten bewerteten Ergebnissen im Kontext einer zweiarmigen randomisierten kontrollierten Studie zur Multiplen Sklerose, vergleicht Wirksamkeit und Typ-I-Fehlerrate durch Simulation und erörtert andere wichtige Überlegungen bei der Verwendung beider Methoden.

Forschungshintergrund und Motivation

Bedeutung des Problems

  1. Bedarf an patientenorientierter Arzneimittelentwicklung: Die traditionelle Auswahl von Studienendpunkten basiert häufig auf dem Konsens von Forschern und Regulierungsbehörden und ignoriert die Heterogenität individueller Patientenpräferenzen
  2. Multidimensionalität komplexer Krankheiten: Komplexe Krankheiten wie Multiple Sklerose und rheumatoide Arthritis beeinflussen mehrere Symptombereiche, und verschiedene Patienten legen unterschiedliches Gewicht auf Verbesserungen verschiedener Symptome
  3. Regulatorische Förderung: Die FDA-Anleitung zur Migränemedikamentenentwicklung von 2018 erkannte erstmals offiziell die Verwendung von Patienten ausgewählten Ergebnissen an

Einschränkungen bestehender Methoden

  1. Traditionelle Konsensmethoden: Ignorieren die Heterogenität der Patientenpräferenzen und können möglicherweise nicht die Ergebnisse widerspiegeln, die Patienten tatsächlich interessieren
  2. Mehrere gemeinsame primäre Endpunkte: Erfordern Wirksamkeitsnachweise bei allen Ergebnissen, was möglicherweise zu streng ist
  3. Mangelnde Individualisierung: Nutzen Informationen über individuelle Patientenpräferenzen nicht vollständig, um das Studiendesign und die Analyse zu optimieren

Forschungsmotivation

Dieses Papier zielt darauf ab, zwei Methoden zur Einbeziehung von Patientenpräferenzen systematisch zu vergleichen: von Patienten ausgewählte Ergebnisse (nur die wichtigsten Ergebnisse berücksichtigung) und von Patienten bewertete Ergebnisse (vollständige Wichtigkeitsrangfolge berücksichtigung), um methodische Richtlinien für das Studiendesign bereitzustellen.

Kernbeiträge

  1. Analysemethoden für von Patienten ausgewählte Ergebnisse entwickelt: Zwei statistische Methoden zur Analyse von Patienten ausgewählten Ergebnissen entwickelt (Mittelwertvergleichsmethode und Proportionsprüfung)
  2. Systematischer Vergleich der statistischen Leistung verschiedener Methoden: Durch Simulationsstudien wurden Wirksamkeit und Typ-I-Fehlerrate von Patienten ausgewählten Ergebnissen, Patienten bewerteten Ergebnissen (zusammengesetztes DOOR) und traditioneller univariater Analyse verglichen
  3. Praktische Richtlinien für die Methodenauswahl bereitgestellt: Basierend auf Faktoren wie Verteilung der Patientenpräferenzen und Korrelation zwischen Ergebnissen wurden konkrete Empfehlungen für die Methodenauswahl gegeben
  4. Methodologie patientenorientierter klinischer Studien erweitert: Erweiterung von binären Ergebnissen in der Migräne auf kontinuierliche Ergebnisse, Grundlage für breitere Anwendung geschaffen

Methodische Details

Aufgabendefinition

In einer zweiarmigen randomisierten kontrollierten Studie werden die Auswirkungen der experimentellen Gruppe (k=1) und der Kontrollgruppe (k=0) auf mehrere Ergebnisse verglichen, wobei jeder Patient m kontinuierliche Ergebnisse Yi = (Yi,1, ..., Yi,m) und entsprechende Präferenzinformationen hat.

Methode der von Patienten ausgewählten Ergebnisse

1. Mittelwert-Patienten-Auswahlmethode

Für das von Patient i ausgewählte Ergebnis si, angenommen Yi,j ~ N(μai,j, σ²ai), unter Verwendung des Welch-t-Tests:

t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)

wobei Ȳk = (1/nk)Σ1{ai = k}Yi,si

Schlüsselbedingungen: Um die korrekte Verteilung unter der Nullhypothese sicherzustellen, müssen folgende Bedingungen erfüllt sein:

  • Bedingung 1: n1,j/n1 = n0,j/n0 (durch schichtweise Randomisierung nach ausgewähltem Ergebnis erreicht)
  • Bedingung 2: μj = 0 (wie bei Placebo-Kontrolle)

2. Proportionsprüfungsmethode

Definieren Sie ein binäres Ergebnis: Y*i = 1{Yi,si > λsi}, wobei λsi die minimal klinisch wichtige Differenz (MCID) ist Verwenden Sie den Wald-Test, um die Proportionen zwischen den beiden Gruppen zu vergleichen, die klinisch bedeutsame Verbesserungen erreichen.

Methode der von Patienten bewerteten Ergebnisse

Zusammengesetzte DOOR-Methode

Für jedes Patientenpaar (i0, i1) definieren Sie den DOOR-Indikator für einzelne Ergebnisse:

Zi0,i1(j) = {
  1    wenn Yi1,j - Yi0,j > MCIDj
  0    wenn Yi1,j - Yi0,j < MCIDj  
  0.5  wenn |Yi1,j - Yi0,j| ≤ MCIDj
}

Durch einen iterativen Algorithmus wird die Patientenbewertungshierarchie berücksichtigt, von der kleinsten gemeinsamen Rangfolgemenge bis zur größten Menge, um das zusammengesetzte DOOR zu bestimmen.

Schätzer: θ̂ = (1/n0n1)ΣΣZi0,i1

Gewichtete Gewinnwahrscheinlichkeitsmethode (WWP)

Schichten Sie nach dem bevorzugten Ergebnis des Patienten, berechnen Sie die Gewinnwahrscheinlichkeit jeder Schicht und gewichten Sie dann den Durchschnitt: θ̂WT = Σp̂jθ̂j

wobei p̂j der Anteil der Patienten ist, die Ergebnis j als am wichtigsten auswählen.

Technische Innovationspunkte

  1. Theoretische Grundlagen der schichtweisen Randomisierung: Klärung der theoretischen Bedingungen für die Analyse von Patienten ausgewählten Ergebnissen
  2. Erweiterung auf kontinuierliche Ergebnisse: Erweiterung von Patienten ausgewählten Ergebnissen von binären auf kontinuierliche Ergebnisse
  3. Systematischer Vergleichsrahmen: Aufbau eines statistischen Rahmens für faire Vergleiche zwischen verschiedenen Methoden

Experimentelle Einrichtung

Simulationsdesign

Basierend auf dem Design einer klinischen Studie zur Multiplen Sklerose mit drei Ergebnissen: Müdigkeit, Schmerz, Depression.

Datengenerierungsmechanismus

  • Stichprobengröße: 60 Patienten, 1:1 Randomisierung
  • Ergebnisverteilung: Trivariate Normalverteilung, Kovarianzmatrix berücksichtigt niedrige (0,25), mittlere (0,55) und hohe (0,75) Korrelation
  • Patientenpräferenzen:
    • Ungleiche Präferenzen: (p123, p132, p213, p231, p312, p321) = (0,42, 0,17, 0,24, 0,05, 0,08, 0,04)
    • Gleiche Präferenzen: Jede Rangfolge 1/6

Simulationsszenarien

8 Szenarien mit verschiedenen Behandlungseffektmustern:

  • S1: Kein Effekt (Nullhypothese)
  • S2: Gleichmäßige Verbesserung aller Ergebnisse
  • S3: Nur Müdigkeitsverbesserung (59% der Patienten bevorzugt)
  • S4: Nur Depressionverbesserung (12% der Patienten bevorzugt)
  • S5-S8: Verschiedene Kombinationseffekte und Wechselwirkungen

Bewertungsindikatoren

  • Typ-I-Fehlerrate: Ablehnungsrate in Szenario 1
  • Statistische Wirksamkeit: Ablehnungsrate in Szenarien 2-8
  • Monte-Carlo-Standardfehler: <0,5% (basierend auf 10⁴ Wiederholungen)

Experimentelle Ergebnisse

Hauptergebnisse

Vergleich der Wirksamkeit unter ungleichen Präferenzen

MethodeS1S2S3S4S5S6S7S8
Zusammengesetztes DOOR6,099,859,926,476,680,959,21,8
WWP6,798,065,67,971,278,425,50,4
Mittelwert-Patientenauswahl4,898,768,58,874,881,628,00,4
Proportionsprüfung2,891,454,48,059,666,223,04,0

Schlüsselfunde

  1. Kontrolle der Typ-I-Fehlerrate: Die Mittelwert-Patienten-Auswahlmethode kontrolliert die Typ-I-Fehlerrate gut auf dem 5%-Niveau
  2. Wirksamkeitsvorteilssituationen: Wenn das von den meisten Patienten bevorzugte Ergebnis eine große Behandlungswirkung hat (z. B. S3), ist die Wirksamkeit der Patienten-Auswahlmethode vergleichbar mit dem zusammengesetzten DOOR
  3. Korrelationseinfluss: Hohe Korrelation reduziert die Wirksamkeit des zusammengesetzten DOOR, hat aber weniger Auswirkungen auf die Patienten-Auswahlmethode
  4. Gleiche vs. ungleiche Präferenzen: Unter gleichen Präferenzen ist der Vorteil des zusammengesetzten DOOR ausgeprägter

Ablationsstudien

Auswirkung der Korrelationsstruktur

  • Niedrige Korrelation: Wirksamkeit des zusammengesetzten DOOR verbessert sich, Patienten-Auswahlmethode bleibt grundsätzlich unverändert
  • Hohe Korrelation: Wirksamkeit des zusammengesetzten DOOR sinkt, Patienten-Auswahlmethode bleibt stabil

Auswirkung von Grenzeffekten

Mit MCID=0:

  • Wirksamkeit des zusammengesetzten DOOR unter ungleichen Präferenzen deutlich verbessert
  • WWP und Proportionsprüfung zeigen leichte Wirksamkeitsabnahme

Verwandte Arbeiten

Patientenorientierte Arzneimittelentwicklung

  • FDA-Richtlinienserie 2018-2023 fördert PFDD-Entwicklung
  • Migräne-Behandlungsanleitung erkannte erstmals offiziell von Patienten ausgewählte Ergebnisse an

Methodologie zusammengesetzter Endpunkte

  • DOOR-Methode ursprünglich bei Infektionskrankheiten verwendet
  • PROOF-Methode-Anwendung bei ALS
  • Entwicklung verwandter Methoden wie Win Ratio

Analyse mehrerer Ergebnisse

  • Traditionelle Methode mehrerer gemeinsamer primärer Endpunkte
  • Hierarchische Tests und Gating-Verfahren
  • Methoden zur Einbeziehung von Patientenpräferenzgewichtungen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Bedingte Vorteile: Die Patienten-Auswahlmethode ist funktional äquivalent zum zusammengesetzten DOOR, wenn die von den meisten Patienten bevorzugten Ergebnisse eine Behandlungswirkung zeigen und die Ergebnisse mittelhoch korreliert sind
  2. Vereinfachungsvorteile: Die Patienten-Auswahl ist leichter umzusetzen und erfordert nur die Erfassung der wichtigsten Ergebnisse statt der vollständigen Rangfolge
  3. Regulatorische Akzeptanz: Die Patienten-Auswahl hat bereits regulatorische Präzedenzfälle und ist leichter zu genehmigen

Einschränkungen

  1. Anforderungen an theoretische Bedingungen: Erfordert schichtweise Randomisierung oder spezifische Nullhypothesenbedingungen
  2. Unzureichende Informationsnutzung: Kann wichtige Behandlungseffekte bei nicht bevorzugten Ergebnissen übersehen
  3. Parametrische Methodenbeschränkungen: Aktuelle Methoden setzen Normalverteilung voraus, Erweiterung auf andere Verteilungen erforderlich

Zukünftige Richtungen

  1. Verbundene Modellierung: Entwicklung von Strategien für gemeinsame Analyse mit Informationsausleihe
  2. Nichtparametrische Methoden: Erweiterung auf Analysemethoden für verschiedene Ergebnistypen
  3. Einbeziehung von Kovariaten: Berücksichtigung des Einflusses von Patientenmerkmalen auf Präferenzen und Ergebnisse
  4. Kontinuierliche Präferenzgewichtungen: Entwicklung von DOOR-Methoden für kontinuierliche Präferenzgewichtungen

Tiefgreifende Bewertung

Stärken

  1. Hoher praktischer Wert: Löst praktische Probleme in klinischen Studien mit klaren Anwendungsszenarien
  2. Methodisch streng: Bietet vollständige theoretische Grundlagen und statistisches Inferenzgerüst
  3. Umfassender Vergleich: Systematischer Vergleich mehrerer Methoden unter Berücksichtigung mehrerer Einflussfaktoren
  4. Angemessenes Simulationsdesign: Basierend auf realen klinischen Studienszenarien mit glaubwürdigen Parametereinstellungen

Mängel

  1. Stichprobengrößenbeschränkung: Simulation basiert auf relativ kleiner Stichprobengröße (60), Leistung bei größeren Stichproben erfordert weitere Überprüfung
  2. Krankheitsspezifität: Hauptsächlich auf Multiple-Sklerose-Szenarien basierend, Anwendbarkeit auf andere Krankheiten erfordert Überprüfung
  3. Annahme der Präferenzstabilität: Geht davon aus, dass Patientenpräferenzen während der Studie unverändert bleiben, was in der Praxis möglicherweise nicht der Fall ist
  4. MCID-Festlegung: Die zusammengesetzte DOOR-Methode hängt von der MCID-Festlegung ab, deren Rationalität umstritten ist

Auswirkungen

  1. Methodische Beiträge: Bietet wichtige statistische Methodenwerkzeuge für patientenorientierte klinische Studien
  2. Regulatorische Bedeutung: Kann die Entwicklung und Aktualisierung zukünftiger regulatorischer Richtlinien beeinflussen
  3. Anwendungsperspektiven: Breites Anwendungspotenzial in klinischen Studien zu komplexen Krankheiten
  4. Theoretischer Wert: Fördert die Anwendung der personalisierten Medizin im Studiendesign

Anwendungsszenarien

  1. Studien zu komplexen Krankheiten: Multiple Sklerose, rheumatoide Arthritis und andere Mehrfach-Symptom-Krankheiten
  2. Große Heterogenität der Patientenpräferenzen: Situationen, in denen verschiedene Patienten unterschiedliche Prioritäten bei Symptomverbesserungen haben
  3. Kontinuierliche Ergebnismessungen: Studien mit standardisierten Skalen (z. B. PROMIS)
  4. Flexible regulatorische Anforderungen: Bereiche, in denen Regulierungsbehörden innovative Endpunktdesigns akzeptieren

Literaturverzeichnis

  1. US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023.
  2. Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022.
  3. van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022.

Dieses Papier leistet einen wichtigen methodischen Beitrag zur patientenorientierten Arzneimittelentwicklung, insbesondere bei der Abwägung zwischen statistischer Effizienz und Individualisierung von Patientenpräferenzen. Trotz einiger Einschränkungen haben sowohl sein praktischer Wert als auch seine theoretische Bedeutung großes Potenzial, die Entwicklung des Studiendesigns in eine patientenzentriertere Richtung zu fördern.