A key aspect of patient-focused drug development is identifying and measuring outcomes that are important to patients in clinical trials. Many medical conditions affect multiple symptom domains, and a consensus approach to determine the relative importance of the associated multiple outcomes ignores the heterogeneity in individual patient preferences. Patient-selected outcomes offer one way to incorporate individual patient preferences, as proposed in recent regulatory guidance for the treatment for migraine, where each patient selects their most bothersome migraine-associated symptom in addition to pain. Patient-ranked outcomes have also recently been proposed, which go further and consider the full ranking of the relative importance of all the outcomes. This can be assessed using a composite DOOR (Desirability of Outcome Ranking) endpoint. In this paper, we compare the advantages and disadvantages of using patient-selected versus patient-ranked outcomes in the context of a two-arm randomised controlled trial for multiple sclerosis. We compare the power and type I error rate by simulation, and discuss several other important considerations when using the two approaches.
論文ID : 2510.11578タイトル : A comparison of approaches to incorporate patient-selected and patient-ranked outcomes in clinical trials著者 : David S. Robertson, Thomas Jaki分類 : stat.ME(統計方法論)発表日 : 2025年10月13日(arXiv プレプリント)論文リンク : https://arxiv.org/abs/2510.11578 患者指向型医薬品開発の重要な側面は、臨床試験において患者にとって重要な結果を特定し測定することである。多くの疾患は複数の症状領域に影響を及ぼし、関連する複数の結果の相対的重要性に関するコンセンサスアプローチは、個々の患者の嗜好の異質性を無視している。患者選択結果は、個々の患者の嗜好を組み込む方法を提供し、FDAが最近発表した片頭痛治療ガイダンスで提案されているように、各患者は痛みに加えて最も困っている片頭痛関連症状を選択する必要がある。最近、患者ランク付け結果も提案されており、すべての結果の相対的重要性の完全なランキングをさらに考慮し、複合DOOR(結果ランキングの望ましさ)エンドポイントを通じて評価できる。本論文は、多発性硬化症の二腕無作為化対照試験の文脈において、患者選択結果と患者ランク付け結果の使用の長所と短所を比較し、シミュレーションを通じて検出力とI型エラー率を比較し、これら両方の方法を使用する際の他の重要な考慮事項について議論する。
患者指向型医薬品開発の必要性 :従来の臨床試験エンドポイント選択は、研究者と規制機関のコンセンサスに基づいており、患者個人の嗜好の異質性を無視している複雑疾患の多次元性 :多発性硬化症、関節リウマチなどの複雑疾患は複数の症状領域に影響を及ぼし、異なる患者は各症状改善の重要度が異なる規制認可の推進 :FDA 2018年片頭痛医薬品開発ガイダンスは、患者選択結果の使用を初めて正式に認可した従来のコンセンサス方法 :患者間の嗜好の異質性を無視し、患者が実際に関心を持つ結果を真に反映できない可能性がある複数の共同主要エンドポイント :すべての結果で効果を示す必要があり、過度に厳格である可能性がある個別化考慮の欠如 :患者個人の嗜好情報を十分に活用して試験設計と分析を最適化していない本論文は、患者の嗜好を組み込む2つの方法、すなわち患者選択結果(最も重要な結果のみを考慮)と患者ランク付け結果(重要性の完全なランキングを考慮)を体系的に比較し、臨床試験設計に対する方法論的ガイダンスを提供することを目的としている。
患者選択結果の分析方法を提案 :患者選択結果を分析するための2つの統計的方法(平均比較法と比率検定法)を開発した異なる方法の統計的性能を体系的に比較 :シミュレーション研究を通じて、患者選択結果、患者ランク付け結果(複合DOOR)、および従来の単変量分析の検出力とI型エラー率を比較した方法選択の実用的ガイダンスを提供 :患者嗜好分布、結果間の相関性などの要因に基づいて、方法選択に対する具体的な推奨事項を提供した患者指向型臨床試験方法論を拡張 :片頭痛の二分類結果から連続結果へ拡張し、より広範な応用の基礎を確立した二腕無作為化対照試験において、実験群(k=1)と対照群(k=0)を複数の結果で比較する。各患者はm個の連続結果Yi = (Yi,1, ..., Yi,m)と対応する嗜好情報を有する。
患者iが選択した結果siについて、Yi,j ~ N(μai,j, σ²ai)と仮定し、Welch t検定を使用する:
t = (Ȳ1 - Ȳ0) / √(d²0/n0 + d²1/n1)
ここで、Ȳk = (1/nk)Σ1{ai = k}Yi,si
重要な条件 :帰無仮説下で正しい分布を確保するには、以下を満たす必要がある:
条件1:n1,j/n1 = n0,j/n0(選択結果による層別無作為化により実現) 条件2:μj = 0(プラセボ対照など) 二分類結果を定義する:Y*i = 1{Yi,si > λsi}、ここでλsiは最小臨床的に重要な差(MCID)
Wald検定を使用して、臨床的に意義のある改善に達した患者の比率を2群間で比較する。
各患者ペア(i0, i1)について、単一結果のDOOR指標を定義する:
Zi0,i1(j) = {
1 if Yi1,j - Yi0,j > MCIDj
0 if Yi1,j - Yi0,j < MCIDj
0.5 if |Yi1,j - Yi0,j| ≤ MCIDj
}
反復アルゴリズムを通じて患者ランキング階層を考慮し、最小共通ランキング集合から最大集合まで複合DOORを決定する。
推定量:θ̂ = (1/n0n1)ΣΣZi0,i1
患者の首選結果により層別化し、各層の勝利確率を計算してから加重平均する:
θ̂WT = Σp̂jθ̂j
ここで、p̂jは結果jを最も重要として選択した患者の比率である。
層別無作為化の理論的基礎 :患者選択結果分析の理論的条件を明確化した連続結果への拡張 :患者選択結果を二分類から連続結果へ拡張した体系的比較フレームワーク :異なる方法間の公正な比較のための統計的フレームワークを確立した多発性硬化症臨床試験設計に基づき、3つの結果を考慮する:疲労、疼痛、抑うつ。
サンプルサイズ :60名の患者、1:1無作為割り当て結果分布 :三変量正規分布、共分散行列は低(0.25)、中(0.55)、高(0.75)相関を考慮患者嗜好 :
不等嗜好:(p123, p132, p213, p231, p312, p321) = (0.42, 0.17, 0.24, 0.05, 0.08, 0.04) 等嗜好:各ランキングは1/6 異なる治療効果パターンをカバーする8つのシナリオ:
S1:効果なし(帰無仮説) S2:すべての結果が均等に改善 S3:疲労のみ改善(59%の患者の首選) S4:抑うつのみ改善(12%の患者の首選) S5-S8:様々な組み合わせ効果と相互作用 I型エラー率 :シナリオ1下での棄却率統計的検出力 :シナリオ2-8下での棄却率モンテカルロ標準誤差 :<0.5%(10⁴回の反復に基づく)方法 S1 S2 S3 S4 S5 S6 S7 S8 複合DOOR 6.0 99.8 59.9 26.4 76.6 80.9 59.2 1.8 WWP 6.7 98.0 65.6 7.9 71.2 78.4 25.5 0.4 平均患者選択 4.8 98.7 68.5 8.8 74.8 81.6 28.0 0.4 比率検定 2.8 91.4 54.4 8.0 59.6 66.2 23.0 4.0
I型エラー率の制御 :平均患者選択結果法は5%水準でI型エラー率を良好に制御できる検出力の優位性 :多くの患者が嗜好する結果に大きな治療効果がある場合(例:S3)、患者選択結果法と複合DOORの検出力は同等である相関性の影響 :高相関性は複合DOORの検出力を低下させるが、患者選択結果法への影響は小さい等嗜好対不等嗜好 :等嗜好条件下では複合DOORの優位性がより明らかである低相関性 :複合DOORの検出力が向上し、患者選択結果法は基本的に変わらない高相関性 :複合DOORの検出力が低下し、患者選択結果法は安定を保つMCID=0を設定した場合:
複合DOORは不等嗜好下で検出力が大幅に向上 WWPと比率検定の検出力はわずかに低下 FDA 2018-2023年一連のガイダンス文書がPFDD発展を推進 片頭痛治療ガイダンスが患者選択結果を初めて正式に認可 DOOR方法は当初感染症で使用された ALS におけるPROOF方法の応用 Win ratioなど関連方法の発展 従来の複数共同主要エンドポイント方法 階層的検定とゲーティング手順 患者嗜好の重み付けを組み込む方法 条件付き優位性 :患者選択結果法は、多くの患者が嗜好する結果に治療効果があり、結果間に中程度から高い相関がある場合、複合DOORと同等の検出力を有する実装の簡潔性 :患者選択結果はより実装しやすく、完全なランキングではなく最も重要な結果のみを収集する必要がある規制受容性 :患者選択結果は既に規制の先例があり、認可を得やすい理論的条件の要件 :層別無作為化または特定の帰無仮説条件が必要情報利用の不十分性 :非首選結果の重要な治療効果を見落とす可能性があるパラメトリック方法の制限 :現在の方法は正規分布を仮定しており、他の分布への拡張が必要結合モデリング :情報を借用する結合分析戦略を開発するノンパラメトリック方法 :異なるタイプの結果の分析方法を拡張する共変量の組み込み :患者特性が嗜好と結果に与える影響を考慮する連続嗜好の重み付け :連続嗜好の重み付けを処理するDOOR方法を開発する実用的価値が高い :臨床試験における実際の問題を解決し、明確な応用シーンを有する方法論的に厳密 :完全な理論的基礎と統計的推論フレームワークを提供する比較が包括的 :複数の方法を体系的に比較し、多くの影響要因を考慮するシミュレーション設計が合理的 :実際の臨床試験シーンに基づき、パラメータ設定が現実的で信頼性があるサンプルサイズの制限 :シミュレーションは比較的小さいサンプルサイズ(60)に基づいており、大規模サンプルでの性能をさらに検証する必要がある疾患特異性 :主に多発性硬化症のシーンに基づいており、他の疾患への適用可能性を検証する必要がある患者嗜好の安定性仮定 :患者嗜好が試験期間中変わらないと仮定しているが、実際には変化する可能性があるMCID設定 :複合DOOR方法はMCID設定に依存しているが、その合理性には議論がある方法論的貢献 :患者指向型臨床試験に重要な統計的方法論ツールを提供する規制的意義 :将来の規制ガイダンスの制定と更新に影響を与える可能性がある応用の見通し :複雑疾患の臨床試験において広範な応用の可能性を有する理論的価値 :個別化医療の臨床試験設計への応用を推進する複雑疾患試験 :多発性硬化症、関節リウマチなど複数症状の疾患患者嗜好の異質性が大きい :異なる患者の症状改善優先度の差が明らかな場合連続結果測定 :標準化スケール(PROMIS等)で測定された試験規制の柔軟性 :規制機関が革新的なエンドポイント設計を受け入れる領域US Food and Drug Administration. FDA Patient-Focused Drug Development Guidance Series. 2018-2023. Lu, Y., et al. A composite endpoint for treatment benefit according to patient preference. Statistics in Biopharmaceutical Research, 2022. van Eijk, R.P., et al. Composite endpoint for ALS clinical trials based on patient preference. Journal of Neurology, Neurosurgery & Psychiatry, 2022. 本論文は患者指向型医薬品開発に対して重要な方法論的貢献を提供しており、特に統計的効率と患者嗜好の個別化のバランスをいかに取るかという点で貢献している。いくつかの限界は存在するが、その実用的価値と理論的意義は両方とも顕著であり、臨床試験設計をより患者中心の方向へ発展させることが期待される。