2025-11-13T19:40:11.201973

A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials

Robertson, Jaki

A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.

academic

Una comparación de enfoques para incorporar resultados seleccionados y clasificados por pacientes en ensayos clínicos

Información Básica

ID del Artículo: 2510.11578
Título: Una comparación de enfoques para incorporar resultados seleccionados y clasificados por pacientes en ensayos clínicos
Autores: David S. Robertson, Thomas Jaki
Clasificación: stat.ME (Metodología Estadística)
Fecha de Publicación: 13 de octubre de 2025 (preimpresión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.11578

Resumen

Un aspecto clave del desarrollo de fármacos orientado al paciente es identificar y medir los resultados que son importantes para los pacientes en ensayos clínicos. Muchas enfermedades afectan múltiples dominios de síntomas, y los métodos de consenso para determinar la importancia relativa de los múltiples resultados relevantes ignoran la heterogeneidad de las preferencias de los pacientes individuales. Los resultados seleccionados por el paciente proporcionan un método para incorporar las preferencias de los pacientes individuales, como se propone en la guía de tratamiento de la migraña publicada recientemente por la FDA, donde cada paciente debe seleccionar el síntoma relacionado con la migraña más problemático además del dolor. También se han propuesto recientemente resultados clasificados por pacientes, que consideran además la clasificación completa de la importancia relativa de todos los resultados, evaluable mediante el punto final compuesto DOOR (Deseabilidad de Ordenamiento de Resultados). Este artículo compara las ventajas y desventajas de usar resultados seleccionados por pacientes versus resultados clasificados por pacientes en el contexto de un ensayo controlado aleatorizado de dos brazos en esclerosis múltiple, comparando la potencia e índices de error tipo I mediante simulación, y discutiendo otras consideraciones importantes al usar ambos métodos.

Antecedentes y Motivación de la Investigación

Importancia del Problema

Necesidad del desarrollo de fármacos orientado al paciente: La selección tradicional de puntos finales en ensayos clínicos se basa a menudo en el consenso de investigadores y organismos reguladores, ignorando la heterogeneidad de las preferencias individuales de los pacientes
Multidimensionalidad de enfermedades complejas: Enfermedades complejas como la esclerosis múltiple y la artritis reumatoide afectan múltiples dominios de síntomas, y diferentes pacientes tienen diferentes niveles de énfasis en la mejora de cada síntoma
Impulso regulatorio: La guía de desarrollo de fármacos para la migraña de la FDA de 2018 fue la primera en reconocer formalmente el uso de resultados seleccionados por pacientes

Limitaciones de los Métodos Existentes

Métodos de consenso tradicionales: Ignoran la heterogeneidad de preferencias entre pacientes, posiblemente sin reflejar verdaderamente los resultados que preocupan a los pacientes
Múltiples puntos finales coprimarios: Requieren demostrar efecto en todos los resultados, lo que puede ser excesivamente restrictivo
Falta de consideración individualizada: No aprovecha suficientemente la información de preferencias individuales de los pacientes para optimizar el diseño y análisis del ensayo

Motivación de la Investigación

Este artículo tiene como objetivo comparar sistemáticamente dos métodos para incorporar preferencias de pacientes: resultados seleccionados por pacientes (considerando solo el resultado más importante) y resultados clasificados por pacientes (considerando la clasificación completa de importancia), proporcionando orientación metodológica para el diseño de ensayos clínicos.

Contribuciones Principales

Propone métodos de análisis para resultados seleccionados por pacientes: Desarrolla dos métodos estadísticos para analizar resultados seleccionados por pacientes (método de comparación de medias y prueba de proporciones)
Compara sistemáticamente el desempeño estadístico de diferentes métodos: Mediante estudios de simulación compara la potencia e índices de error tipo I de resultados seleccionados por pacientes, resultados clasificados por pacientes (DOOR compuesto) y análisis univariados tradicionales
Proporciona orientación práctica para la selección de métodos: Basada en la distribución de preferencias de pacientes, correlación entre resultados y otros factores, proporciona recomendaciones específicas para la selección de métodos
Extiende la metodología de ensayos clínicos orientados al paciente: Expande los resultados seleccionados por pacientes desde resultados binarios en migraña a resultados continuos, sentando las bases para aplicaciones más amplias

Explicación Detallada de Métodos

Definición de la Tarea

En un ensayo controlado aleatorizado de dos brazos, comparar el efecto del grupo experimental (k=1) versus grupo control (k=0) en múltiples resultados, donde cada paciente tiene m resultados continuos Yi = (Yi,1, ..., Yi,m) e información de preferencia correspondiente.

Método de Resultados Seleccionados por Pacientes

1. Método de Resultados Seleccionados por Pacientes de Media

Para el resultado si seleccionado por el paciente i, asumiendo Yi,j ~ N(μai,j, σ²ai), usando la prueba t de Welch:

t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)

donde Ȳk = (1/nk)Σ1{ai = k}Yi,si

Condiciones clave: Para asegurar la distribución correcta bajo la hipótesis nula, se deben cumplir:

Condición 1: n1,j/n1 = n0,j/n0 (implementada mediante aleatorización estratificada por resultado seleccionado)
Condición 2: μj = 0 (como en control con placebo)

2. Prueba de Proporciones

Definir resultado binario: Y*i = 1{Yi,si > λsi}, donde λsi es la diferencia clínicamente importante mínima (MCID) Usar la prueba de Wald para comparar la proporción de pacientes que logran mejora clínicamente significativa entre los dos grupos.

Método de Resultados Clasificados por Pacientes

Método DOOR Compuesto

Para cada par de pacientes (i0, i1), definir el indicador DOOR de resultado individual:

Zi0,i1(j) = {
  1    si Yi1,j - Yi0,j > MCIDj
  0    si Yi1,j - Yi0,j < MCIDj  
  0.5  si |Yi1,j - Yi0,j| ≤ MCIDj
}

Mediante un algoritmo iterativo considerar la jerarquía de clasificación de pacientes, desde el conjunto de clasificación común mínimo hasta el conjunto máximo, determinando el DOOR compuesto.

Estimador: θ̂ = (1/n0n1)ΣΣZi0,i1

Método de Probabilidad de Victoria Ponderada (WWP)

Estratificar por resultado preferido del paciente, calcular la probabilidad de victoria en cada estrato, luego promediar ponderadamente: θ̂WT = Σp̂jθ̂j

donde p̂j es la proporción de pacientes que seleccionan el resultado j como más importante.

Puntos de Innovación Técnica

Fundamento teórico de aleatorización estratificada: Aclara las condiciones teóricas para el análisis de resultados seleccionados por pacientes
Extensión a resultados continuos: Expande los resultados seleccionados por pacientes desde clasificación binaria a resultados continuos
Marco de comparación sistemática: Establece un marco estadístico para comparación justa entre diferentes métodos

Configuración Experimental

Diseño de Simulación

Basado en el diseño de ensayo clínico de esclerosis múltiple, considerando tres resultados: fatiga, dolor, depresión.

Mecanismo de Generación de Datos

Tamaño de muestra: 60 pacientes, asignación aleatoria 1:1
Distribución de resultados: Distribución normal trivariada, matriz de covarianza considerando correlación baja (0.25), media (0.55), alta (0.75)
Preferencias de pacientes:
- Preferencias desiguales: (p123, p132, p213, p231, p312, p321) = (0.42, 0.17, 0.24, 0.05, 0.08, 0.04)
- Preferencias iguales: cada clasificación es 1/6

Escenarios de Simulación

8 escenarios que abarcan diferentes patrones de efecto de tratamiento:

S1: Sin efecto (hipótesis nula)
S2: Mejora uniforme en todos los resultados
S3: Solo mejora en fatiga (resultado preferido del 59% de pacientes)
S4: Solo mejora en depresión (resultado preferido del 12% de pacientes)
S5-S8: Varios efectos combinados e interacciones

Indicadores de Evaluación

Índice de error tipo I: Tasa de rechazo en el escenario 1
Potencia estadística: Tasa de rechazo en escenarios 2-8
Error estándar de Monte Carlo: <0.5% (basado en 10⁴ repeticiones)

Resultados Experimentales

Resultados Principales

Comparación de Potencia bajo Preferencias Desiguales

Método	S1	S2	S3	S4	S5	S6	S7	S8
DOOR Compuesto	6.0	99.8	59.9	26.4	76.6	80.9	59.2	1.8
WWP	6.7	98.0	65.6	7.9	71.2	78.4	25.5	0.4
Media Seleccionada por Paciente	4.8	98.7	68.5	8.8	74.8	81.6	28.0	0.4
Prueba de Proporciones	2.8	91.4	54.4	8.0	59.6	66.2	23.0	4.0

Hallazgos Clave

Control del índice de error tipo I: El método de media de resultados seleccionados por pacientes controla bien el índice de error tipo I al nivel del 5%
Situaciones de ventaja de potencia: Cuando el resultado preferido por la mayoría de pacientes tiene un efecto de tratamiento mayor (como S3), el método de resultados seleccionados por pacientes tiene potencia comparable al DOOR compuesto
Impacto de correlación: La correlación alta reduce la potencia del DOOR compuesto, pero tiene menor impacto en el método de resultados seleccionados por pacientes
Preferencias iguales vs desiguales: Bajo preferencias iguales, la ventaja del DOOR compuesto es más evidente

Experimentos de Ablación

Impacto de la Estructura de Correlación

Correlación baja: Aumento de potencia del DOOR compuesto, método de resultados seleccionados por pacientes básicamente sin cambios
Correlación alta: Disminución de potencia del DOOR compuesto, método de resultados seleccionados por pacientes mantiene estabilidad

Impacto de Efectos Marginales

Configuración con MCID=0:

DOOR compuesto muestra aumento significativo de potencia bajo preferencias desiguales
WWP y prueba de proporciones muestran ligera disminución de potencia

Trabajo Relacionado

Desarrollo de Fármacos Orientado al Paciente

Series de documentos de orientación de la FDA 2018-2023 impulsan el desarrollo de PFDD
La guía de tratamiento de migraña fue la primera en reconocer formalmente los resultados seleccionados por pacientes

Metodología de Puntos Finales Compuestos

Método DOOR originalmente utilizado en enfermedades infecciosas
Aplicación del método PROOF en ELA
Desarrollo de métodos relacionados como win ratio

Análisis de Múltiples Resultados

Método tradicional de múltiples puntos finales coprimarios
Pruebas jerárquicas y procedimientos de compuerta
Métodos para incorporar pesos de preferencia de pacientes

Conclusiones y Discusión

Conclusiones Principales

Ventajas condicionales: El método de resultados seleccionados por pacientes tiene potencia comparable al DOOR compuesto cuando el resultado preferido por la mayoría de pacientes tiene efecto de tratamiento y hay correlación media-alta entre resultados
Ventajas de simplificación: Los resultados seleccionados por pacientes son más fáciles de implementar, requiriendo solo recopilar el resultado más importante en lugar de la clasificación completa
Aceptabilidad regulatoria: Los resultados seleccionados por pacientes ya tienen precedente regulatorio, facilitando la aprobación

Limitaciones

Requisitos de condiciones teóricas: Requiere aleatorización estratificada o condiciones específicas de hipótesis nula
Utilización insuficiente de información: Puede perder efectos de tratamiento importantes en resultados no preferidos
Limitaciones de métodos paramétricos: Los métodos actuales asumen distribución normal, necesitando extensión a otras distribuciones

Direcciones Futuras

Modelado conjunto: Desarrollar estrategias de análisis conjunto que tomen prestada información
Métodos no paramétricos: Extender a métodos de análisis para diferentes tipos de resultados
Incorporación de covariables: Considerar el impacto de características de pacientes en preferencias y resultados
Pesos de preferencia continuos: Desarrollar métodos DOOR que manejen pesos de preferencia continuos

Evaluación Profunda

Fortalezas

Alto valor práctico: Resuelve problemas reales en ensayos clínicos con escenarios de aplicación claros
Rigor metodológico: Proporciona fundamento teórico completo y marco de inferencia estadística
Comparación integral: Compara sistemáticamente múltiples métodos considerando diversos factores influyentes
Diseño de simulación razonable: Basado en escenarios de ensayos clínicos reales con parámetros creíbles

Insuficiencias

Limitación de tamaño de muestra: Simulaciones basadas en tamaño de muestra relativamente pequeño (60), requiriendo verificación de desempeño en muestras grandes
Especificidad de enfermedad: Principalmente basado en escenarios de esclerosis múltiple, necesitando verificación de aplicabilidad en otras enfermedades
Supuesto de estabilidad de preferencia: Asume que las preferencias de pacientes permanecen constantes durante el ensayo, aunque en la práctica pueden cambiar
Configuración de MCID: El método DOOR compuesto depende de la configuración de MCID, cuya razonabilidad es controvertida

Impacto

Contribución metodológica: Proporciona herramientas metodológicas estadísticas importantes para ensayos clínicos orientados al paciente
Significado regulatorio: Puede influir en la formulación y actualización de futuras guías regulatorias
Perspectivas de aplicación: Tiene amplio potencial de aplicación en ensayos clínicos de enfermedades complejas
Valor teórico: Avanza la aplicación de medicina individualizada en el diseño de ensayos clínicos

Escenarios de Aplicabilidad

Ensayos de enfermedades complejas: Esclerosis múltiple, artritis reumatoide y otras enfermedades multisintomáticas
Heterogeneidad grande de preferencias de pacientes: Situaciones donde diferentes pacientes tienen diferencias evidentes en prioridades de mejora de síntomas
Medición de resultados continuos: Ensayos usando escalas estandarizadas (como PROMIS) para medir resultados
Flexibilidad regulatoria: Dominios donde los organismos reguladores aceptan diseños de puntos finales innovadores

Referencias

US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023.
Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022.
van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022.

Este artículo proporciona una contribución metodológica importante para el desarrollo de fármacos orientado al paciente, particularmente en cómo equilibrar la eficiencia estadística con la individualización de preferencias de pacientes. Aunque tiene algunas limitaciones, su valor práctico y significado teórico son ambos considerables, con potencial para impulsar el diseño de ensayos clínicos hacia una dirección más centrada en el paciente.