2025-11-13T19:40:11.201973

A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials

Robertson, Jaki
A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.
academic

Сравнение подходов к включению результатов, выбранных и ранжированных пациентами, в клинические испытания

Основная информация

  • ID статьи: 2510.11578
  • Название: A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials
  • Авторы: David S. Robertson, Thomas Jaki
  • Классификация: stat.ME (статистическая методология)
  • Дата публикации: 13 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.11578

Аннотация

Ключевым аспектом ориентированной на пациента разработки лекарственных средств является выявление и измерение исходов, важных для пациентов, в клинических испытаниях. Многие заболевания поражают несколько областей симптомов, а консенсусные методы определения относительной важности соответствующих множественных исходов игнорируют гетерогенность индивидуальных предпочтений пациентов. Результаты, выбранные пациентами, предоставляют метод включения индивидуальных предпочтений пациентов, как предложено в недавно опубликованном руководстве FDA по лечению мигрени, где каждый пациент выбирает наиболее беспокоящий симптом мигрени помимо боли. Недавно также были предложены результаты, ранжированные пациентами, которые дополнительно учитывают полное ранжирование относительной важности всех исходов, оцениваемые через композитную конечную точку DOOR (желательность упорядочивания исходов). В данной статье сравниваются преимущества и недостатки использования результатов, выбранных пациентами, и результатов, ранжированных пациентами, в контексте двухгруппового рандомизированного контролируемого испытания при рассеянном склерозе. Посредством моделирования сравниваются мощность и частота ошибок I типа, а также обсуждаются другие важные соображения при использовании обоих методов.

Исследовательский контекст и мотивация

Важность проблемы

  1. Потребность в ориентированной на пациента разработке лекарственных средств: Традиционный выбор конечных точек клинических испытаний часто основывается на консенсусе исследователей и регулирующих органов, игнорируя гетерогенность индивидуальных предпочтений пациентов
  2. Многомерность сложных заболеваний: Сложные заболевания, такие как рассеянный склероз и ревматоидный артрит, поражают несколько областей симптомов, и разные пациенты по-разному оценивают улучшение каждого симптома
  3. Стимулирование нормативными актами: Руководство FDA 2018 года по разработке лекарств от мигрени впервые официально признало использование результатов, выбранных пациентами

Ограничения существующих методов

  1. Традиционные консенсусные методы: Игнорируют гетерогенность предпочтений между пациентами, что может не отражать истинные результаты, интересующие пациентов
  2. Множественные совместные первичные конечные точки: Требуют демонстрации эффекта на всех исходах, что может быть чрезмерно строгим
  3. Отсутствие индивидуализированного рассмотрения: Не полностью использует информацию об индивидуальных предпочтениях пациентов для оптимизации дизайна и анализа испытания

Исследовательская мотивация

Данная статья направлена на систематическое сравнение двух методов включения предпочтений пациентов: результатов, выбранных пациентами (рассматривающих только наиболее важный исход), и результатов, ранжированных пациентами (рассматривающих полное ранжирование важности), чтобы предоставить методологическое руководство для дизайна клинических испытаний.

Основные вклады

  1. Предложены методы анализа результатов, выбранных пациентами: Разработаны два статистических метода анализа результатов, выбранных пациентами (метод сравнения средних и метод проверки пропорций)
  2. Систематическое сравнение статистических характеристик различных методов: Посредством моделирования сравниваются мощность и частота ошибок I типа результатов, выбранных пациентами, результатов, ранжированных пациентами (композитная DOOR), и традиционного одномерного анализа
  3. Предоставлено практическое руководство по выбору методов: На основе распределения предпочтений пациентов, корреляции между исходами и других факторов предоставлены конкретные рекомендации по выбору методов
  4. Расширение методологии клинических испытаний, ориентированных на пациента: Расширение от бинарных исходов при мигрени к непрерывным исходам, создание основы для более широкого применения

Подробное описание методов

Определение задачи

В двухгруппном рандомизированном контролируемом испытании сравниваются эффекты экспериментальной группы (k=1) и контрольной группы (k=0) на множественные исходы, где каждый пациент имеет m непрерывных исходов Yi = (Yi,1, ..., Yi,m) и соответствующую информацию о предпочтениях.

Метод результатов, выбранных пациентами

1. Метод среднего результата, выбранного пациентом

Для исхода si, выбранного пациентом i, предполагая Yi,j ~ N(μai,j, σ²ai), используется t-критерий Уэлча:

t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)

где Ȳk = (1/nk)Σ1{ai = k}Yi,si

Ключевые условия: Для обеспечения правильного распределения при нулевой гипотезе необходимо выполнение:

  • Условие 1: n1,j/n1 = n0,j/n0 (реализуется посредством стратифицированной рандомизации по выбранному исходу)
  • Условие 2: μj = 0 (как при плацебо-контролируемом испытании)

2. Метод проверки пропорций

Определение бинарного исхода: Y*i = 1{Yi,si > λsi}, где λsi — минимальная клинически значимая разница (MCID) Использование критерия Вальда для сравнения пропорций достижения клинически значимого улучшения в двух группах.

Метод результатов, ранжированных пациентами

Метод композитной DOOR

Для каждой пары пациентов (i0, i1) определяется индикатор DOOR для отдельного исхода:

Zi0,i1(j) = {
  1    если Yi1,j - Yi0,j > MCIDj
  0    если Yi1,j - Yi0,j < MCIDj  
  0.5  если |Yi1,j - Yi0,j| ≤ MCIDj
}

Посредством итеративного алгоритма рассматривается иерархия ранжирования пациентов, от наименьшего общего набора ранжирования к наибольшему, определяется композитная DOOR.

Оценка: θ̂ = (1/n0n1)ΣΣZi0,i1

Метод взвешенной вероятности победы (WWP)

Стратификация по предпочитаемому пациентом исходу, расчет вероятности победы для каждого слоя, затем взвешенное усреднение: θ̂WT = Σp̂jθ̂j

где p̂j — доля пациентов, выбравших исход j как наиболее важный.

Технические инновации

  1. Теоретическая основа стратифицированной рандомизации: Уточнены теоретические условия анализа результатов, выбранных пациентами
  2. Расширение на непрерывные исходы: Расширение результатов, выбранных пациентами, от бинарной классификации к непрерывным исходам
  3. Систематическая сравнительная база: Установлена статистическая база для справедливого сравнения между различными методами

Экспериментальная установка

Дизайн моделирования

На основе дизайна клинического испытания при рассеянном склерозе рассматриваются три исхода: усталость, боль, депрессия.

Механизм генерации данных

  • Размер выборки: 60 пациентов, рандомизация 1:1
  • Распределение исходов: Трёхмерное нормальное распределение, матрица ковариаций рассматривает низкую (0,25), среднюю (0,55) и высокую (0,75) корреляцию
  • Предпочтения пациентов:
    • Неравномерные предпочтения: (p123, p132, p213, p231, p312, p321) = (0,42, 0,17, 0,24, 0,05, 0,08, 0,04)
    • Равномерные предпочтения: каждое ранжирование составляет 1/6

Сценарии моделирования

8 сценариев охватывают различные модели лечебного эффекта:

  • S1: Отсутствие эффекта (нулевая гипотеза)
  • S2: Равномерное улучшение всех исходов
  • S3: Улучшение только усталости (59% предпочтение пациентов)
  • S4: Улучшение только депрессии (12% предпочтение пациентов)
  • S5-S8: Различные комбинированные эффекты и взаимодействия

Показатели оценки

  • Частота ошибок I типа: Частота отклонения при сценарии 1
  • Статистическая мощность: Частота отклонения при сценариях 2-8
  • Стандартная ошибка Монте-Карло: <0,5% (на основе 10⁴ повторений)

Результаты экспериментов

Основные результаты

Сравнение мощности при неравномерных предпочтениях

МетодS1S2S3S4S5S6S7S8
Композитная DOOR6,099,859,926,476,680,959,21,8
WWP6,798,065,67,971,278,425,50,4
Средний результат, выбранный пациентом4,898,768,58,874,881,628,00,4
Проверка пропорций2,891,454,48,059,666,223,04,0

Ключевые находки

  1. Контроль ошибки I типа: Метод среднего результата, выбранного пациентом, хорошо контролирует ошибку I типа на уровне 5%
  2. Преимущества в мощности: Когда исход, предпочитаемый большинством пациентов, имеет большой лечебный эффект (например, S3), результаты, выбранные пациентами, и композитная DOOR имеют сравнимую мощность
  3. Влияние корреляции: Высокая корреляция снижает мощность композитной DOOR, но оказывает меньшее влияние на метод результатов, выбранных пациентами
  4. Равномерные vs неравномерные предпочтения: При равномерных предпочтениях преимущество композитной DOOR более очевидно

Абляционные эксперименты

Влияние структуры корреляции

  • Низкая корреляция: Мощность композитной DOOR повышается, метод результатов, выбранных пациентами, остаётся практически неизменным
  • Высокая корреляция: Мощность композитной DOOR снижается, метод результатов, выбранных пациентами, остаётся стабильным

Влияние граничных эффектов

При установке MCID=0:

  • Мощность композитной DOOR значительно повышается при неравномерных предпочтениях
  • Мощность WWP и проверки пропорций немного снижается

Связанные работы

Ориентированная на пациента разработка лекарственных средств

  • Серия руководств FDA 2018-2023 гг. стимулировала развитие PFDD
  • Руководство по лечению мигрени впервые официально признало результаты, выбранные пациентами

Методология композитных конечных точек

  • Метод DOOR первоначально использовался при инфекционных заболеваниях
  • Применение метода PROOF при БАС
  • Развитие связанных методов, таких как win ratio

Анализ множественных исходов

  • Традиционный метод множественных совместных первичных конечных точек
  • Иерархические тесты и процедуры ограничения
  • Методы включения взвешивания предпочтений пациентов

Выводы и обсуждение

Основные выводы

  1. Условные преимущества: Метод результатов, выбранных пациентами, имеет сравнимую мощность с композитной DOOR, когда исход, предпочитаемый большинством пациентов, имеет лечебный эффект и исходы имеют среднюю или высокую корреляцию
  2. Преимущества упрощения: Результаты, выбранные пациентами, легче реализовать, требуя сбора только наиболее важного исхода, а не полного ранжирования
  3. Приемлемость регулирующими органами: Результаты, выбранные пациентами, уже имеют нормативный прецедент, что облегчает получение одобрения

Ограничения

  1. Требования теоретических условий: Требуется стратифицированная рандомизация или специфические условия нулевой гипотезы
  2. Неполное использование информации: Может упустить важные лечебные эффекты на непредпочитаемых исходах
  3. Ограничения параметрических методов: Текущие методы предполагают нормальное распределение, требуется расширение на другие распределения

Будущие направления

  1. Совместное моделирование: Разработка стратегий совместного анализа с заимствованием информации
  2. Непараметрические методы: Расширение методов анализа на различные типы исходов
  3. Включение ковариат: Рассмотрение влияния характеристик пациентов на предпочтения и исходы
  4. Непрерывные веса предпочтений: Разработка методов DOOR для обработки непрерывных весов предпочтений

Глубокая оценка

Преимущества

  1. Высокая практическая ценность: Решает реальные проблемы в клинических испытаниях с чёткими сценариями применения
  2. Методологическая строгость: Предоставляет полную теоретическую основу и статистическую базу для вывода
  3. Всеобъемлющее сравнение: Систематически сравнивает несколько методов, рассматривая множество влияющих факторов
  4. Разумный дизайн моделирования: На основе реальных сценариев клинических испытаний с достоверными параметрами

Недостатки

  1. Ограничение размера выборки: Моделирование основано на относительно небольшом размере выборки (60), требуется дальнейшая проверка характеристик при большом размере выборки
  2. Специфичность заболевания: Главным образом основано на сценариях рассеянного склероза, требуется проверка применимости к другим заболеваниям
  3. Предположение о стабильности предпочтений: Предполагается, что предпочтения пациентов остаются неизменными в течение испытания, что может не соответствовать действительности
  4. Установка MCID: Метод композитной DOOR зависит от установки MCID, обоснованность которой вызывает сомнения

Влияние

  1. Методологический вклад: Предоставляет важные статистико-методологические инструменты для клинических испытаний, ориентированных на пациента
  2. Нормативное значение: Может повлиять на разработку и обновление будущих нормативных руководств
  3. Перспективы применения: Имеет широкий потенциал применения в клинических испытаниях сложных заболеваний
  4. Теоретическая ценность: Продвигает применение персонализированной медицины в дизайне клинических испытаний

Сценарии применения

  1. Испытания при сложных заболеваниях: Многосимптомные заболевания, такие как рассеянный склероз, ревматоидный артрит
  2. Высокая гетерогенность предпочтений пациентов: Ситуации, когда разные пациенты существенно различаются в приоритизации улучшения симптомов
  3. Измерение непрерывных исходов: Испытания с использованием стандартизированных шкал (например, PROMIS)
  4. Гибкие нормативные требования: Области, где регулирующие органы принимают инновационные дизайны конечных точек

Библиография

  1. US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023.
  2. Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022.
  3. van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022.

Данная статья предоставляет важный методологический вклад в ориентированную на пациента разработку лекарственных средств, особенно в вопросе балансирования статистической эффективности и индивидуализации предпочтений пациентов. Несмотря на некоторые ограничения, её практическая ценность и теоретическое значение весьма значительны и, вероятно, будут способствовать развитию дизайна клинических испытаний в направлении более ориентированного на пациента подхода.