2025-11-13T19:40:11.201973

A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials

Robertson, Jaki

A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.

academic

임상시험에서 환자 선택 및 환자 순위 결과를 통합하는 접근 방식의 비교

기본 정보

논문 ID: 2510.11578
제목: A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials
저자: David S. Robertson, Thomas Jaki
분류: stat.ME (통계 방법론)
발표 시간: 2025년 10월 13일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.11578

초록

환자 중심 의약품 개발의 핵심 측면은 임상시험에서 환자에게 중요한 결과를 식별하고 측정하는 것입니다. 많은 질병이 여러 증상 영역에 영향을 미치며, 관련된 다중 결과의 상대적 중요성에 대한 합의 방법은 개별 환자 선호도의 이질성을 무시합니다. 환자 선택 결과는 개별 환자 선호도를 통합하는 방법을 제공하며, FDA의 최근 편두통 치료 지침에서 제시된 바와 같이 각 환자는 통증 외에도 가장 문제가 되는 편두통 관련 증상을 선택해야 합니다. 최근 환자 순위 결과도 제안되었으며, 이는 모든 결과의 상대적 중요성에 대한 완전한 순위를 고려하며, 복합 DOOR(결과 순위의 기대 가능성) 종점을 통해 평가할 수 있습니다. 본 논문은 다발성 경화증의 이중 맹검 무작위 대조 시험 배경에서 환자 선택 결과와 환자 순위 결과 사용의 장단점을 비교하고, 시뮬레이션을 통해 통계력과 제1종 오류율을 비교하며, 두 방법 사용 시 기타 중요한 고려 사항을 논의합니다.

연구 배경 및 동기

문제의 중요성

환자 중심 의약품 개발의 필요성: 전통적인 임상시험 종점 선택은 연구자 및 규제 기관의 합의에 기반하며, 개별 환자 선호도의 이질성을 무시합니다
복잡한 질병의 다차원성: 다발성 경화증, 류마티스 관절염 등의 복잡한 질병은 여러 증상 영역에 영향을 미치며, 다양한 환자들이 각 증상 개선을 다르게 중시합니다
규제 승인의 추진: FDA 2018년 편두통 의약품 개발 지침이 환자 선택 결과 사용을 처음으로 공식적으로 승인했습니다

기존 방법의 한계

전통적 합의 방법: 환자 간 선호도의 이질성을 무시하여 환자가 실제로 관심 있는 결과를 반영하지 못할 수 있습니다
다중 공동 주요 종점: 모든 결과에서 효과를 보여야 하므로 과도하게 엄격할 수 있습니다
개별화 고려 부족: 환자 개별 선호도 정보를 충분히 활용하여 시험 설계 및 분석을 최적화하지 못합니다

연구 동기

본 논문은 환자 선호도를 통합하는 두 가지 방법, 즉 환자 선택 결과(가장 중요한 결과만 고려)와 환자 순위 결과(완전한 중요도 순위 고려)를 체계적으로 비교하여 임상시험 설계에 대한 방법론적 지침을 제공하는 것을 목표로 합니다.

핵심 기여

환자 선택 결과의 분석 방법 제시: 환자 선택 결과를 분석하기 위한 두 가지 통계 방법(평균 비교법 및 비율 검정법) 개발
다양한 방법의 통계적 성능 체계적 비교: 시뮬레이션 연구를 통해 환자 선택 결과, 환자 순위 결과(복합 DOOR) 및 전통적 단변량 분석의 통계력과 제1종 오류율 비교
방법 선택에 대한 실용적 지침 제공: 환자 선호도 분포, 결과 간 상관성 등의 요인에 기반하여 방법 선택에 대한 구체적 권장사항 제시
환자 중심 임상시험 방법론 확장: 편두통의 이분 결과에서 연속 결과로 확장하여 더 광범위한 적용을 위한 기초 마련

방법론 상세 설명

작업 정의

이중 맹검 무작위 대조 시험에서 실험군(k=1)과 대조군(k=0)을 m개의 연속 결과 Yi = (Yi,1, ..., Yi,m)과 해당 선호도 정보를 가진 여러 결과에서 비교합니다.

환자 선택 결과 방법

1. 평균 환자 선택 결과법

환자 i가 선택한 결과 si에 대해, Yi,j ~ N(μai,j, σ²ai)를 가정하고 Welch t 검정을 사용합니다:

t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)

여기서 Ȳk = (1/nk)Σ1{ai = k}Yi,si

핵심 조건: 귀무가설 하에서 올바른 분포를 보장하기 위해 다음을 만족해야 합니다:

조건 1: n1,j/n1 = n0,j/n0 (선택 결과별 층화 무작위화를 통해 실현)
조건 2: μj = 0 (위약 대조 등)

2. 비율 검정법

이분 결과 정의: Y*i = 1{Yi,si > λsi}, 여기서 λsi는 최소 임상 중요 차이(MCID) 두 군 간 임상적으로 의미 있는 개선을 달성한 비율을 비교하기 위해 Wald 검정을 사용합니다.

환자 순위 결과 방법

복합 DOOR 방법

각 환자 쌍(i0, i1)에 대해 단일 결과의 DOOR 지표를 정의합니다:

Zi0,i1(j) = {
  1    if Yi1,j - Yi0,j > MCIDj
  0    if Yi1,j - Yi0,j < MCIDj  
  0.5  if |Yi1,j - Yi0,j| ≤ MCIDj
}

반복 알고리즘을 통해 환자 순위 계층을 고려하여 최소 공통 순위 집합에서 최대 집합까지 복합 DOOR을 결정합니다.

추정량: θ̂ = (1/n0n1)ΣΣZi0,i1

가중 승리 확률(WWP) 방법

환자의 선호 결과별로 층화하여 각 층의 승리 확률을 계산한 후 가중 평균합니다: θ̂WT = Σp̂jθ̂j

여기서 p̂j는 결과 j를 가장 중요한 것으로 선택한 환자의 비율입니다.

기술적 혁신 포인트

층화 무작위화의 이론적 기초: 환자 선택 결과 분석의 이론적 조건을 명확히 함
연속 결과로의 확장: 환자 선택 결과를 이분 분류에서 연속 결과로 확장
체계적 비교 프레임워크: 다양한 방법 간 공정한 비교를 위한 통계 프레임워크 구축

실험 설정

시뮬레이션 설계

다발성 경화증 임상시험 설계를 기반으로 피로, 통증, 우울증의 세 가지 결과를 고려합니다.

데이터 생성 메커니즘

표본 크기: 60명의 환자, 1:1 무작위 배치
결과 분포: 3변량 정규분포, 공분산 행렬은 낮음(0.25), 중간(0.55), 높음(0.75) 상관성 고려
환자 선호도:
- 불균등 선호도: (p123, p132, p213, p231, p312, p321) = (0.42, 0.17, 0.24, 0.05, 0.08, 0.04)
- 균등 선호도: 각 순위는 1/6

시뮬레이션 시나리오

다양한 치료 효과 패턴을 포함하는 8가지 시나리오:

S1: 효과 없음(귀무가설)
S2: 모든 결과의 균등 개선
S3: 피로만 개선(59% 환자의 첫 선택)
S4: 우울증만 개선(12% 환자의 첫 선택)
S5-S8: 다양한 조합 효과 및 상호작용

평가 지표

제1종 오류율: 시나리오 1에서의 기각률
통계력: 시나리오 2-8에서의 기각률
Monte Carlo 표준 오차: <0.5%(10⁴회 반복 기반)

실험 결과

주요 결과

불균등 선호도 조건에서의 통계력 비교

방법	S1	S2	S3	S4	S5	S6	S7	S8
복합 DOOR	6.0	99.8	59.9	26.4	76.6	80.9	59.2	1.8
WWP	6.7	98.0	65.6	7.9	71.2	78.4	25.5	0.4
평균 환자 선택	4.8	98.7	68.5	8.8	74.8	81.6	28.0	0.4
비율 검정	2.8	91.4	54.4	8.0	59.6	66.2	23.0	4.0

주요 발견

제1종 오류율 제어: 평균 환자 선택 결과법은 5% 수준에서 제1종 오류율을 잘 제어합니다
통계력 우위 상황: 대다수 환자가 선호하는 결과에 더 큰 치료 효과가 있을 때(예: S3), 환자 선택 결과법과 복합 DOOR의 통계력이 비슷합니다
상관성 영향: 높은 상관성은 복합 DOOR의 통계력을 감소시키지만, 환자 선택 결과법에는 영향이 적습니다
균등 선호도 vs 불균등 선호도: 균등 선호도 조건에서 복합 DOOR의 우위가 더 명확합니다

제거 실험

상관성 구조의 영향

낮은 상관성: 복합 DOOR 통계력 향상, 환자 선택 결과법은 기본적으로 변화 없음
높은 상관성: 복합 DOOR 통계력 감소, 환자 선택 결과법은 안정적 유지

한계 효과의 영향

MCID=0 설정 시:

복합 DOOR은 불균등 선호도에서 통계력이 현저히 향상됨
WWP 및 비율 검정의 통계력은 약간 감소

결론 및 논의

주요 결론

조건부 우위: 환자 선택 결과법은 대다수 환자가 선호하는 결과에 치료 효과가 있고 결과 간 중간~높은 상관성이 있을 때 복합 DOOR과 비슷한 통계력을 보입니다
단순화 우위: 환자 선택 결과는 구현이 더 용이하며, 완전한 순위가 아닌 가장 중요한 결과만 수집하면 됩니다
규제 수용도: 환자 선택 결과는 이미 규제 선례가 있어 승인을 받기가 더 용이합니다

한계

이론적 조건 요구: 층화 무작위화 또는 특정 귀무가설 조건이 필요합니다
정보 활용 부족: 비선호 결과의 중요한 치료 효과를 놓칠 수 있습니다
모수 방법 제한: 현재 방법은 정규분포를 가정하며, 다른 분포로의 확장이 필요합니다

향후 방향

연합 모델링: 정보 차용 연합 분석 전략 개발
비모수 방법: 다양한 유형의 결과 분석 방법으로 확장
공변량 통합: 환자 특성이 선호도 및 결과에 미치는 영향 고려
연속 선호도 가중치: 연속 선호도 가중치를 처리하는 DOOR 방법 개발

심층 평가

장점

높은 실용 가치: 임상시험의 실제 문제를 해결하며 명확한 적용 시나리오가 있습니다
방법론적 엄밀성: 완전한 이론적 기초 및 통계 추론 프레임워크를 제공합니다
포괄적 비교: 다양한 방법을 체계적으로 비교하고 여러 영향 요인을 고려합니다
합리적 시뮬레이션 설계: 실제 임상시험 시나리오를 기반으로 하며 매개변수 설정이 현실적입니다

부족한 점

표본 크기 제한: 시뮬레이션이 작은 표본 크기(60)를 기반으로 하며, 대표본에서의 성능은 추가 검증이 필요합니다
질병 특이성: 주로 다발성 경화증 시나리오를 기반으로 하며, 다른 질병에의 적용 가능성은 검증이 필요합니다
선호도 안정성 가정: 시험 기간 동안 환자 선호도가 변하지 않는다고 가정하지만, 실제로는 변할 수 있습니다
MCID 설정: 복합 DOOR 방법은 MCID 설정에 의존하지만, 그 합리성에는 논쟁이 있습니다

영향력

방법론적 기여: 환자 중심 임상시험을 위한 중요한 통계 방법론 도구 제공
규제적 의의: 향후 규제 지침의 제정 및 업데이트에 영향을 미칠 수 있습니다
응용 전망: 복잡한 질병의 임상시험에서 광범위한 적용 가능성이 있습니다
이론적 가치: 개인화 의학을 임상시험 설계에 적용하는 것을 추진합니다

적용 시나리오

복잡한 질병 시험: 다발성 경화증, 류마티스 관절염 등 다중 증상 질병
환자 선호도 이질성이 큼: 다양한 환자들이 증상 개선 우선순위를 크게 다르게 생각하는 경우
연속 결과 측정: 표준화된 척도(예: PROMIS)를 사용하여 측정하는 시험
규제 유연성: 규제 기관이 혁신적 종점 설계를 수용하는 분야

참고문헌

US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023.
Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022.
van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022.

본 논문은 환자 중심 의약품 개발에 중요한 방법론적 기여를 제공하며, 특히 통계적 효율성과 환자 선호도 개별화 간의 균형을 맞추는 방법에 있어서 그러합니다. 일부 한계가 있지만, 실용적 가치와 이론적 의의 모두 매우 중요하며, 임상시험 설계를 보다 환자 중심적인 방향으로 발전시킬 것으로 기대됩니다.