統計解析.com

統計解析業務の
アウトソーシング

無料相談を
予約する

JAMAガイドラインに沿って作る統計解析計画書 (Section 3)

アウトライン
  1. 作成日: 2025/12/2
  2. 更新日: –

はじめに

統計解析計画書 (Statistical Analysis Plan; SAP) は、ヒト臨床試験 (ヒト試験) のプロトコルに記載された解析方針を、より技術的かつ詳細に記述した文書です。

本稿は、JAMAにてGamble C, et al (2017) が示したガイドラインに沿ってSAPを作成する方法をまとめます。

SAPの基本的な概要は以下のコラムにまとめているので、興味がある方は、画像をクリックして読んでいただけると幸いです。

SAPのチェックリスト

Section 3のチェックリストは以下の通りです:

表1. 「Section 3: 試験方法 [Study Methods]」のチェックリスト

Section/Item Index Description
試験デザイン 9 試験デザインの簡単な説明:試験のタイプ (例: 並行群、マルチアーム、クロスオーバー、要因)、割付比率、介入の簡単な説明を含む
無作為化 / ランダム化 10 無作為化の詳細 (動的な割り当て(最小化など) や層別化が行われたかどうかなど) (使用された層別化因子や、SAP内に保持されていない場合はその情報の場所を含む)。
サンプルサイズ 11 サンプルサイズ計算の完全な詳細、またはプロトコルでのサンプルサイズ計算の参照 (SAPでの複製の代わりに)
フレームワーク 12 優越性、同等性、非劣性試験の仮説検証の枠組みと、それに基づいてどのような比較を提示するか
統計的中間解析と中止ガイダンス 13a 中間解析に関する情報 どのような中間解析が行われるのか、時点の一覧を示す。
13b 中間解析による有意水準の計画的な調整
13c 試験を早期に中止するためのガイドラインの詳細
最終解析の時期 14 最終的な分析のタイミング 例:全ての結果をまとめて分析、または計画された追跡期間によって層別されたタイミング
アウトカム評価の時期 15 成果を測定する時点(訪問 “ウィンドウ “を含む

Gamble C, et al (2017) から引用、改変

次の章から、このチェックリストに沿って、どのようにSAPを書いていくか紹介します。

SAPを作成する

3.1 試験デザイン-試験デザインの説明 [Trial design – description of trial design]

Item 9: 試験デザイン

試験デザインについて、試験の種類 (並行群、マルチアーム、クロスオーバー、ファクトリアルなど)、割付比率、介入内容の概要を含めて記述する。

試験デザインの種類を明確にすることは重要です。これは、採用される統計手法、バイアスのリスク、試験の実施方法、コスト、得られる結果の性質、そして最終的な解釈など、多くの側面に影響を及ぼすためです。

たとえば、要因計画 (ファクトリアルデザイン) や適応デザインは、並行群の優越性試験と比較して、より複雑な方法論・解析手法・解釈を必要とする場合があります。

多くの試験では均等割り付け (例: 2群で1:1) が採用されていますが、割付比率を明記することは依然として重要です。また、薬物を対象とした試験では、試験のフェーズ (Phase I~IV) を示すことが有用な場合があります。

<記載例>

本試験は、単施設で実施されるランダム化並行群間プラセボ対照試験である。治療割付比率は 1:1とし、被験者は〇〇群またはプラセボ群のいずれかに無作為に割り付けられる。

3.2 ランダム化 [Randomisation]

Item 10: ランダム化

ランダム化の詳細 (例: 動的割付〔最小化法など〕、層別化の有無、使用した層別化因子、およびSAP内で管理されていない場合はその情報の所在) について記載する。

ランダム化プロセスに関する主要な情報はプロトコルに記載することが望ましいです。

とくに、最小化法や層別化を用いた場合のアルゴリズム、ブロックサイズ、層別化因子のカテゴリといった詳細な内容は、割付順序の予測可能性を避けるため、アクセス制限された領域に保存する必要があります。

このように管理することで、SAP作成者や試験関係者が無作為化順序を推測することを防ぎ、一方で、統計解析を担当する統計家は、ICH E9 の指針に基づき、解析に必要な層別化因子を適切に確認・使用できるようになります。

<記載例>

各被験者のランダム化は、ランダム要素を組み込んだ最小化法により実施した。最小化に用いた層別因子は以下の通りである: 性別 (男性/女性)、年齢カテゴリ (例: 20-39歳/40-59歳)、主要アウトカムのベースライン値 (排便回数3回/排便回数4-5回)、および施設 (A施設/B施設/C施設)。これらの因子は、試験群間でバランスの良い割付を確保する目的で選定された。

<記載例>

ランダム化の手順および全体的な割付方法は、臨床試験プロトコルに詳細に記載されている。割付アルゴリズムやブロックサイズなど、ランダム化順序の予測につながり得る情報は、統計マスターファイル内のアクセス制限された領域に安全に保管されている。

3.3 サンプルサイズ [Sample size]

Item 11: サンプルサイズ

サンプルサイズ計算の詳細をSAPに記載するか、またはプロトコル内のサンプルサイズ計算を参照する形とする。

サンプルサイズの計算は、臨床的に意味のある差を検出するために必要な症例数を決定する重要な工程であり、すべての臨床試験に不可欠の情報です。

臨床的に重要と考えられる最小差 (clinically important difference) の大きさは、得られた結果を解釈する際の基礎となります。サンプルサイズの正当性を示すために、必要に応じて想定される脱落率を含めるべきです。

また、効果量、検出力 (power)、有意水準 (alpha) など、計算の前提となる全てのパラメータを明確に示し、併せて使用した統計ソフトウェアの名称・バージョン、ならびにパラメータ設定を支持する参考文献を提示する必要があります。

他の統計担当者が同じ結果を再現できるよう、計算手順と前提条件を十分な詳細で記載することが求められています。

サンプルサイズの統計学的留意事項は、以下のコラムをチェックしてください。

<記載例>

両側有意水準0.05の2群t検定を用い、主要アウトカムの共通標準偏差を1.50と仮定した場合、各群143名のサンプルサイズは、平均値の差0.50を検出するために80%の検出力を有する。本試験では、試験期間中の脱落を約10%と見込み、これを考慮すると、総計 316 名(各群 158 名) の被験者を組み入れる必要がある。本サンプルサイズ算出に用いた標準偏差の推定値および効果量 (差 0.50) は、〇〇 (例: 【1】本研究と同様の対象者・条件で実施された先行研究、【2】企業内で実施された探索的試験(事前調査)、【3】機能性表示食品に関する公表文献における報告値) に基づき設定したものである。既存の臨床研究では、主要アウトカムに対して 0.4〜0.6 程度の群間差 が、一貫して臨床的・実務的に意味のある最小差 (MCID: minimal clinically important difference) として扱われている。本試験で採用した0.50の差は、これまでの文献的根拠から考えて、検証すべき妥当で現実的な効果量と判断される。

3.4 フレームワーク [Framework]

Item 12: フレームワーク

優越性、同等性、または非劣性のいずれの枠組みで仮説検証を行うのか、またどの比較がその枠組みに基づいて評価されるのかを明確にする。

試験の枠組み (優越性・同等性・非劣性) を特定することは、介入間の差をどのように検証するかという試験全体の目的を規定する重要な要素です。

例えば、主要アウトカムに対しては同等性の検証を主要目的とする一方、副次アウトカムについては優越性を検証する場合もあります。

SAPでは、各アウトカムに適用される枠組みを明示するまたは試験全体に適用される包括的な方針 (グローバルステートメント) を提示することによって、解析方針を明確に示す必要があります。

<記載例>

本試験では、主要アウトカムおよび副次的アウトカムのすべてについて、摂取群がプラセボ群より良好な結果を示すかどうかを検証する優越性試験の枠組みを用いる。すべての解析は、両側有意水準5%を用いて、群間差を評価する。

3.5 統計的中間解析と停止ガイダンス [Statistical Interim analyses and stopping guidance]

Item 13a: 中間解析

中間解析が計画されている場合は、実施する中間解析の種類と、その実施時点 (タイミング) を明確に記載する。

中間解析に関する必要な情報として、

  • 使用する統計手法
  • 解析を実施する責任者 (または独立した組織)
  • 実施する中間解析の内容 (安全性、中止基準、効果判定など)
  • 実施の時期や頻度

を含め、適切な詳細を記述することが求められます。

中間解析を計画していない場合は、明確化のため、その旨をSAPに明記する必要があります。なお、中間解析の詳細がプロトコル、DMC (Data Monitoring Committee) 憲章、またはその他の文書に記載されている場合には、情報の重複を避けるため、それらの文書を参照することもできます。また、中間解析専用のSAP (Interim SAP) が存在する場合は、その文書を参照します。

<記載例>

本試験では、主要評価項目に対して1回の正式な統計学的中間解析を計画している。中間解析は、目標の被験者数の約50%が登録・観察を完了した時点で実施する。

Item 13b: 中間解析の基準

中間解析を実施する場合は、複数時点での解析に伴う1型過誤 (Type I error) の増加を防ぐため、どのような有意水準調整を行うかを明確に記載する。

複数の中間時点でデータを評価する場合、偽陽性リスクが増大するため、Type I errorを適切にコントロールする統計手法の使用が必須です。この目的のために、Heybittle–Peto法、O’Brien–Fleming法など、さまざまな有意水準調整法が提案されています。

採用する方法については、

  • 手法の名称
  • 採用理由 (正当性)
  • 参考文献

をSAP内に明示する必要があります。

また、該当する場合は、DMC (Data Monitoring Committee) 憲章に記載されている方針を参照することもできます。

Item 13c: 早期中止のガイドライン

試験を早期に中止するためのガイドラインの詳細を記載する。

試験を早期に中止するためのガイドラインについて、その内容を明確に記載します。早期中止の判断基準において統計的手法を用いるかどうかについても、明示する必要があります。

<記載例>

中間解析では、O’Brien–Fleming 法に基づくα-spendingアプローチを用いて、有意水準を調整する。中間解析で使用する有意水準は、最終解析での5% (両側) を維持するように設定する。

<記載例>

中間解析では、Haybittle–Peto法に基づく厳格な基準を用いて、誤検出 (Type I Error) の増加を防ぐ。なお、試験の継続可否は、p値のみに依存するのではなく、結果の一貫性、効果の大きさ、安全性、実務的観点など、総合的な判断に基づいて決定する。

<記載例>

正式な中間解析は、独立した統計担当者または安全性評価者により実施し、蓄積データの安全性や傾向を確認する目的で行う。試験継続の判断は、効果の傾向、安全性、試験実施上の妥当性などを総合的に評価して決定し、特定の統計しきい値のみに基づいて中止することはない。

3.6 最終解析の時期 [Timing of final analysis]

Item 14: 最終解析の時期

最終解析を実施する時期について、必要に応じてその詳細を記載する。最終解析のタイミングは、すべてのアウトカムを一括して解析するのか、あるいは追跡期間の違いに応じて解析時期を層別化するのかを明確に示す必要がある。

短期アウトカムと長期アウトカムの両方を設定している場合には、

  • それぞれの解析時期
  • 各アウトカムの結果をどのように報告するか (例: 短期アウトカムを先に報告し、長期アウトカムを後日公表するなど)

といった点についても、SAPにおいて適切な詳細を記載すべきです。

<記載例>

本試験の最終解析は、すべての被験者が主要評価項目の測定を完了し、データが回収・クリーニングされた時点で実施する。副次的アウトカムを含む追加解析は、必要に応じて、全被験者が追跡観察期間を完了した後に行う。

<記載例>

最終解析は、全被験者が主要評価項目を評価するための所定の訪問 (例: 12週間時点、4週間時点など) を完了し、すべてのデータが受領されクリーニングされた後に実施する。副次的評価項目や探索的アウトカムについては、追跡期間が必要な項目 (例: 日誌データ、VAS、QOL指標など) がすべて回収された後に追加解析を行う。

3.7 アウトカム評価の時期 [Timing of outcome assessments]

Item 15: アウトカム評価の時期

アウトカムを測定する時点を記載する。

アウトカムが測定される時点 (訪問スケジュール) は、通常プロトコル内に表形式で記載されていて、有用な情報です。SAPでは、必要に応じてプロトコルの該当箇所を参照するか、同様の情報を掲載します。

また、解析に必要な場合には、各訪問でアウトカムを測定すべき具体的な時間枠 (例: 摂取後◯分以内、来院日の◯時点など) があるかどうかを明確に記載することが望ましいです。

<記載例>

試験の訪問スケジュールおよび評価タイミングは表〇-〇に示すとおりである。ベースライン測定日を基準として、その後の評価は試験計画で定められた時点 (例: 摂取開始後4週、8週、12週) に実施する。追跡期間が必要な副次的評価項目 (例: 日誌、質問票) は、所定の期間で収集する。

まとめ

本稿は、JAMAに掲載されたGamble C, et al (2017) のガイドラインをもとに、統計解析計画書 (Statistical Analysis Plan; SAP) のSection 3: 試験方法 (Study Methods) の作成方法を整理しました。

Section 3では、統計解析計画書 (SAP) の基盤となる 試験方法の全体像を記述します。本章に含まれる項目 (試験デザイン、ランダム化、サンプルサイズ、中間解析、解析の実施時期、アウトカム測定時期) は、後続の解析手順の前提条件を構築する重要なパートです。

Section 3は「試験デザイン × 統計解析 × データ収集」の接続点であり、以下の3つを明確にするのが目的です。

  • どのような試験で、どのようにデータが得られるのか?
    → 試験デザイン・ランダム化・アウトカム測定時期
  • どれくらいのデータ量で、何を検証しようとしているのか?
    → サンプルサイズ・フレームワーク
  • いつ・どの段階で解析が行われるのか?
    → 中間解析・早期中止基準・最終解析時期

次の章 (Section 4 以降) では、この「試験方法」を基盤として、実際の解析集団 (解析対象者)、解析変数、統計手法の選択、補助解析、感度解析といった、より具体的な統計解析の手順を示していきます。

Section 3の情報が明確であるほど、後続の章の記述も一貫性を保ちやすくなるので、しっかり記述してきましょう。

関連するサービス

参考文献

  • Gamble C, Krishan A, Stocken D, Lewis S, Juszczak E, Doré C, Williamson PR, Altman DG, Montgomery A, Lim P, Berlin J, Senn S, Day S, Barbachano Y, Loder E. Guidelines for the Content of Statistical Analysis Plans in Clinical Trials. JAMA. 2017 Dec 19;318(23):2337-2343. doi: 10.1001/jama.2017.18556. PMID: 29260229.

このシリーズを読む