統計解析.com

統計解析業務の
アウトソーシング

無料相談を
予約する

JAMAガイドラインに沿って作る統計解析計画書 (Section 6)

アウトライン
  1. 作成日: 2025/12/9
  2. 更新日: –

はじめに

統計解析計画書 (Statistical Analysis Plan; SAP) は、ヒト臨床試験 (ヒト試験) のプロトコルに記載された解析方針を、より技術的かつ詳細に記述した文書です。

本稿は、JAMAにてGamble C, et al (2017) が示したガイドラインに沿ってSAPを作成する方法をまとめます。

SAPの基本的な概要は以下のコラムにまとめているので、興味がある方は、画像をクリックして読んでいただけると幸いです。

SAPのチェックリスト

Section 6のチェックリストは以下の通りです:

表1. 「Section 6: 解析 [Analysis]」のチェックリスト

Section/Item Index Description
解析方法 27a どのような分析方法を用いて、治療効果をどのように示すのか
27b

共変量の調整の詳細を含む、各主要及び副次的な結果の一覧と説明

Any adjustment for covariates

27c 主要及び副次的な結果を一覧にして説明し、以下の詳細を含む:統計的手法の前提条件を確認するために使用した方法
27d 主要及び副次的な結果をリストアップし,以下の詳細を含む説明を行う:分布の仮定 (例: 正規性,比例ハザードなど) が成り立たない場合に使用する代替法
27e 主要及び副次的な結果をリストアップし、以下の詳細を含む説明:各結果について計画された感度分析
27f 主要及び副次的な結果を記載し、以下の詳細を含む:各結果について計画されているサブグループ分析
欠測データ 28 欠損データ-欠損データを扱うための報告と仮定/統計的手法 (多重反復処理など)
追加解析 29 必要な追加統計解析の詳細 例: CACE (Complier-average causal effect) 解析
30 有害性の要約に関する十分な詳細情報(例: 重大度、期待度、因果関係に関する情報、AEのコード化又は分類方法の詳細、有害事象 (AE) データの分析方法 (例: グレード3/4のみ、発生事例分析、介入出現分析)
統計ソフトウェア 31 分析に使用する統計パッケージの詳細 (オプション)
参考文献 32a 非標準的な統計手法のために提供される参考資料
32b データマネジメントプランの参照
32c トライアルマスターファイル及び統計マスターファイルへの参照
32d 他の標準作業手順書又は文書の参照

Gamble C, et al (2017) から引用、改変

次の章から、このチェックリストに沿って、どのようにSAPを書いていくか紹介します。

SAPを作成する

3.1 解析方法 [Analysis methods]

Item 27a: 解析方法の説明

どの解析手法を用いるのか、また治療 (介入) 効果をどのように提示するのかを記載する。

結論は、使用する解析方法によって大きく左右され得るため、解析手法を事前に明確に定義することは極めて重要です。

データ変換を適用する場合には、その根拠と、変換後の結果をどのように解釈するかを併せて記載しましょう。

各アウトカムについて、SAPでは統計的比較に用いる解析方法、および (該当する場合には) どの解析対象集団を含めるかを明示すべきです。

さらに、提示する記述統計量、効果推定値の単位、信頼区間やp値を報告するかどうかなど、用いる要約尺度を明確に規定することが求められます。

一次アウトカムの解析に複数のアプローチ (例: 共変量調整後および未調整解析) を用いる場合には、どれを主要解析 (primary analysis) として採用するかを明確に特定しなければなりません。

<記載例>

主要アウトカム (例: 試験期間中の〇〇の改善) が、摂取群ごとに割合または平均値として報告される。

一次効果の推定には、

  • 群間差 (絶対差)
  • 相対リスク (割合指標の場合) または平均差 (連続量の場合) を用い、いずれも95%信頼区間 (CI) とともに提示する。

アウトカムが二値データ (例: 改善した/改善しなかった、基準値以上/未満) である場合、摂取群間の比較にはFisherの正確確率検定を用い、調整なしの群間比較を実施する。アウトカムが連続データ (例: 食後血糖iAUC、睡眠時間、主観的ストレススコア) である場合には、事前に規定した統計手法 (例: ANCOVA、t検定) に従って解析を行う。

Item 27b: アウトカムの一覧と共変量

主要アウトカムおよび副次アウトカムを一覧化して説明し、共変量調整を行う場合は、その詳細を記載する。

各解析について、SAPでは共変量調整を行うか否かを明確に記述し、調整を行う場合には、使用する共変量 (必要に応じてそのカテゴリーも含む) およびそれらをモデル内でどのように扱うか (固定効果、ランダム効果など) を具体的に示す必要があります。

とくに主要アウトカムについては、調整解析と非調整解析のいずれを主要解析 (primary analysis) として採用するかを明確に事前指定しなければなりません。事前に指定しない場合、解析選択に恣意性が入り、バイアスを生じさせる可能性があるからです。

<記載例>

主要解析に加えて、ベースライン特性で調整した解析もマルチレベル・ロジスティック回帰を用いて実施する。マルチレベル・ロジスティック回帰モデルで調整するベースライン変数は、年齢、性別、BMI、対象指標のベースライン値、生活習慣 (例: 喫煙・運動習慣) などの事前に規定した予後関連因子とする。また、試験実施施設 (または試験サイト) をランダム効果としてモデルに組み込む。

Item 27c: 解析方法の前提条件

主要アウトカムおよび副次アウトカムを一覧化して説明し、採用する統計手法において前提条件 (仮定) をどのように確認するか、その方法の詳細を記載する。

すべての統計的検定は、検定が妥当であり、解析結果の解釈が正確であるために、特定の前提 (assumptions) が成立していることを必要とします。しかし、仮定の成立を確認したうえで解析方法を変更するような二段階分析 (two-stage analysis) は、バイアスにつながる可能性があると指摘されています。

そのため、前提条件を確認する場合には、どの仮定を、どの方法でチェックするかを事前に明確に規定しておくことが極めて重要です。

<記載例>

時間‐イベント型のアウトカムについては、まず比例ハザード (PH) 仮定を確認する。PH仮定の検証には、時間依存性共変量の追加および、スケーリングしたSchoenfeld残差の時間に対するプロットを用いる。PH仮定が十分に満たされない場合には、代替として加速寿命 (AFT) モデルを適用し、AFTモデルの適合性は Q–Q プロットを用いて評価する。

Item 27d: 代替となる解析方法の説明

主要アウトカムおよび副次アウトカムを一覧化して説明し、分布に関する前提 (例: 正規性、比例ハザード性など) が満たされない場合に用いる代替の解析方法について、その詳細を記載する。

多くの分布に関する前提 (assumptions) は、盲検下データレビューにおいて確認可能であり、その結果に基づきSAPを更新することができます。しかし、治療割付を開示しなければ確認できない仮定も存在するため、そのような場合には、前提が成立しない場合に用いる代替解析方法をSAPに事前規定しておく必要があります。

仮定の検証結果に基づいて解析方法を選択したり、基本的前提が成立しないにもかかわらず仮説検定を行ったりすると、バイアスが生じる可能性があります。したがって、どのようなアプローチを採用するかについては慎重に検討しましょう。

具体的には、以下のいずれか、または複数の方法を用いることが考えられます:

  • SAPにおいて代替解析方法を明示し、統計担当者が両者をどのように選択するかの基準を事前に規定して、プロセスの透明性を確保する。
  • 前提に依存しない、または前提に対して頑健な解析手法を採用する (例: 生存時間解析では比例ハザード性を仮定しない制限平均生存時間 (RMST) を用いる。)。
  • SAPにおいて使用する主要解析方法を明確に記載し、追加の仮定セットに基づく感度解析を実施し、結果を比較することを規定する。

<記載例>

比例ハザード (PH) 仮定がデータに適切に当てはまらない場合は、代替モデルとして加速寿命 (AFT) モデルを適用し、Q–Qプロットを用いてその適合性を評価する。AFTモデルでも十分な適合が得られない場合には、残存寿命解析 (Residual Life Analysis) を用いて摂取による効果を要約する。

Item 27e: 感度分析

主要アウトカムおよび副次アウトカムを一覧化して説明し、各アウトカムに対して計画されている感度分析がある場合は、その内容を記載する。

各アウトカムについて、該当する場合には、SAPにおいて感度解析を実施するか否かを明確に記載し、主要解析および副次解析と同等の詳細度で、その内容を具体的に示す必要があります。

また、各感度解析に使用する解析集団 (analysis set) についても、SAPに明確に定義することが求められます。

さらに、SAPでは、感度分析が必要となる欠測データの最小割合 (threshold) が存在する場合は、その基準を明記することが望ましいです。

<記載例>

感度分析では、評価期間を十分に完了しなかったため主要解析に含まれなかった試験参加者も解析対象に加える。これらの試験参加者については、主要アウトカムが改善していない (=効果なし) と仮定してデータを補完する。per-protocol解析および感度分析により、主要解析 (complete-case analysis) の結果がどの程度頑健であるかを検証する。

Item 27f: サブグループ解析

主要アウトカムおよび副次アウトカムを一覧化して説明し、各アウトカムについて計画されているサブグループ解析がある場合は、その内容を記載する。

事前に計画されたサブグループ解析については、対象とするベースライン特性、サブグループ区分のカットオフ値、使用する統計手法、および結果の提示方法 (例: フォレストプロット) を明確に規定する必要があります。

一方で、過剰な数のサブグループ解析は、多重性の観点から避けるべきです。ただし、サブグループ間で効果の一貫性を確認することを主目的とする場合には、適切な範囲で事前計画されたサブグループ解析を行うことは妥当といえます。

<記載例>

主要アウトカムについて、以下の事前に規定したサブグループ解析を実施する。

  • 年齢カテゴリー (例: 40歳未満 vs 40歳以上)
  • 性別 (男性 vs 女性)
  • BMI区分 (例: BMI<25 vs 25以上)
  • 対象となる指標のベースライン値 (例: ベースライン高値 vs 低値)
  • 生活習慣の区分 (例: 運動習慣あり vs なし、喫煙あり vs なし)

解析結果は、摂取群間の交互作用の有無とともに、Forest Plotを用いて提示する。

3.2 欠測データ [Missing data]

Item 28: 欠測の取り扱い方

欠測データの報告方法、および欠測データに関する前提や (多重代入法などの) 統計的取り扱い方法を記載する。

ほとんどの臨床試験では何らかの欠測データが発生し、欠測の種類 (MCAR、MAR、MNAなど) によってはバイアスが生じる可能性があります

そのためSAPには、欠測データをどのように取り扱い、どのように報告するかを明確に記載し、使用する統計手法とその前提 (assumptions) の詳細を示すことが重要です。

SAPでは、欠測アウトカムに対して代入 (imputation) を行うかどうかを明示し、多重代入法 (Multiple Imputation; MI) を使用する場合には、代入モデルに含める変数の一覧を記載する必要があります。

欠測データの取り扱い方法が異なれば、解析結果や結論が変わる可能性があるため、どの状況でどの手法を用いるか、そしてどの方法を主要解析 (primary analysis) として扱うかを、事前に厳密に規定することが極めて重要です。

また、欠測データ処理に異なる手法を用いた場合に結果の頑健性を評価するため、感度解析を行うことが強く推奨されており、これもSAPに明確に記載すべきです。

<記載例>

多重代入 (Multiple Imputation; MI) は、ベースラインおよび中間評価 (例: 4週または8週) ではデータが揃っている一方で、最終評価 (例: 12週) の主要アウトカムが欠測している試験参加者、または質問票の一部のみ回答している試験参加者を補完するために用いる。20回の代入を実施し、Rubinのルールにより推定結果を統合する。MIモデルには、以下を含める:

  • 主要アウトカムのベースライン値および中間評価値
  • 評価票を構成する複数の質問項目 (ベースライン、中間評価、最終評価)
  • 年齢、性別、BMI
  • 生活習慣 (例: 運動習慣、喫煙状況)
  • 試験施設 (site)
  • その他、あらかじめ規定した共変量

解析対象となる試験参加者のみをインピュテーションモデルに含め、多重代入は摂取群ごとに別々に実施する。多施設試験の場合は、施設をランダム効果として組み込んだマルチレベルMIを実施することも検討する。

3.3 追加解析 [Additional Analyses]

Item 29: 追加解析の説明

追加で必要となる統計解析 (例: コンプライア平均因果効果 (Complier Average Causal Effect; CACE) 解析など) がある場合は、その詳細を記載する。

追加で実施する解析がある場合には、その実施理由、解析の目的、具体的な手法についてSAPに明確に記載する必要があります。

これには、仮説生成を目的とした解析や、過去の試験で指摘された点を検証するための、事前に指定された探索的解析などが含まれます。

<記載例>

試験の実施過程において、測定者やスタッフが評価手順に慣れることで、測定精度や手順の安定性が時間とともに向上することがある。このような実施者側の習熟度の変化 (いわゆる学習曲線) を考慮するため、主要アウトカムについて多層ロジスティック回帰を再度実施し、各施設における試験参加者の登録順序を説明変数として学習曲線をモデルに組み込む。これにより、測定手順が安定した段階での摂取効果についても推定を行う。

<記載例>

摂取遵守率 (コンプライアンス) が摂取効果に与える影響を評価するため、準拠平均因果効果 (Complier Average Causal Effect; CACE) 解析を実施する。線形的な関係 (摂取遵守率が高いほど効果が大きいと仮定) に基づき、道具変数回帰を用いて、コンプライアンスが1%向上した際に摂取効果がどの程度増減するかを推定する。

3.4 害 [Harms]

Item 30: 有害事象等の要約

有害事象 (Adverse Events; AE) の要約方法について、重症度、予測性 (expectedness)、因果関係などの情報、AEのコード化・分類方法の詳細、およびAEデータをどのように解析するか (例: グレード3/4のみを対象とする、発生症例数による解析、介入起因性の解析など) について、十分な詳細を記載する。

安全性データの評価は、すべての臨床試験において極めて重要です。

そのためSAPには、安全性データをどの解析集団で評価するか、および安全性データを最終解析報告書でどのように要約するかについて、明確かつ十分な詳細を記載する必要があります。

有害事象 (Adverse Events; AE) については、重症度、因果関係、予期性 (expectedness)、使用するコード体系および分類方法、並びに分類の実施者に関する情報を含めるべきです。

また、有害事象データの要約方法として、事象数 (イベント数) を用いるのか、試験参加者数 (発現数) を用いるのか、どのような解析を実施するのか (例: 記述的比較のみを行うのか、統計学的検定を実施するのか) を明確に記述しなければなりません。

<記載例>

摂取に関連する可能性のある有害事象 (Adverse Events; AE) について、因果関係が『関連あり』『関連の可能性あり』『関連不明』に分類され、それぞれの件数を摂取群ごとに報告する。また、有害事象の重篤度 (軽度・中等度・重度) 別に、各摂取群における発現人数および割合を記述的に比較し、群間の差について臨床的意義を検討する。

<記載例>

各有害事象について、摂取群別に発現した試験参加者数 (および割合) を、重篤度区分 (軽度・中等度・重度) ごとに集計して提示する。各試験参加者については、同一種類の有害事象が複数回発現した場合でも、最も重い重篤度 (最大重症度) のみを使用して集計する。さらに、各有害事象の発現件数 (および割合) についても摂取群別に提示する。安全性評価は記述的に行い、統計的検定は実施しない。

3.5 統計ソフトウェア [Statistical Software]

Item 31: 使用する統計ソフトウェア

解析の実施に使用する統計ソフトウェア (統計パッケージ) の詳細 (任意)

統計解析に使用する統計パッケージについては、SAPにその概要を記載することができます。

ただし、ソフトウェアのバージョン番号は試験期間中に変更される可能性があるため、SAPには記載せず、最終解析報告書に明記することが望ましいです。

<記載例>

統計解析は、原則として〇〇 (例: R、SPSS、SAS、Stata) を用いて実施する。必要に応じて、補助的な解析や検証には、R、Pythonなどの他の統計パッケージを併用することがある。

3.6 参考文献 [References]

Item 32a: 非標準的な手法に関する参考文献

標準的でない統計手法を使用する場合には、その参考文献を提示する。

標準的でない統計手法を使用する場合には、SAPにその手法の参考文献を明記すべきです。

また、その手法が非標準的かどうか判断が難しい場合には、念のため参考文献を記載しましょう。

Item 32b: DMPの参照

データマネジメント計画書 (Data Management Plan; DMP) への参照

データマネジメント計画書 (Data Management Plan; DMP) については、SAP作成時に参照したDMPのバージョン番号を記載する必要があります。これは、最終解析報告書においても重要となるDMPの情報と、SAPを適切にリンクさせるためです。

なお、DMPが存在しない場合には、データの取り扱いおよびデータクリーニングに関する情報がどこに記録されているか (例: データ処理手順の別文書など) を明示することが求められます。

Item 32c: TMFおよびSMFの参照

治験マスターファイル (Trial Master File; TMF) および統計マスターファイル (Statistical Master File; SMF) への参照

統計マスターファイル (Statistical Master File; SMF) は、治験マスターファイル (Trial Master File; TMF) の一部ではあるものの、アクセス制限の観点から別個に保管されることが多いです。

SMFには、無作為化プロセスの詳細や、統計解析計画を実施する際に統計担当者が参照する必要のある特定のプロトコル逸脱情報が含まれている場合があります。

そのため、統計マスターファイルがTMFとは別に保管されている場合には、SAPにおいて両方のファイルを参照することが望ましいです。

Item 32d: SOPの参照

必要に応じて、関連する標準業務手順書 (Standard Operating Procedures; SOP) やその他の関連文書を参照する。

SAPを作成する際には、遵守すべき標準業務手順書 (Standard Operating Procedures; SOPs) や、関連するその他の文書を適切に参照することが求められます。

まとめ

本稿は、JAMAに掲載されたGamble C, et al (2017) のガイドラインをもとに、統計解析計画書 (Statistical Analysis Plan; SAP) のSection 6: 解析 (Analysis) の作成方法を整理しました。

Section 6の内容は、SAPの中核にあたり、「どのデータを、どう扱い、どの手法で解析し、どの仮定のもとに結論を導くのか」という、試験の科学的根拠のすべてを規定するパートです。

機能性表示食品の届出では治験ほどの形式性は要求されないものの、解析計画の事前明確化・透明性・恣意性排除という原則は、むしろ食品試験でも極めて重要です。

この章を押さえることで、「科学的妥当性の高いヒト試験として評価されるSAP」を構築することができます。

関連するサービス

参考文献

  • Gamble C, Krishan A, Stocken D, Lewis S, Juszczak E, Doré C, Williamson PR, Altman DG, Montgomery A, Lim P, Berlin J, Senn S, Day S, Barbachano Y, Loder E. Guidelines for the Content of Statistical Analysis Plans in Clinical Trials. JAMA. 2017 Dec 19;318(23):2337-2343. doi: 10.1001/jama.2017.18556. PMID: 29260229.
  • Kahan BC. Bias in randomised factorial trials. Stat Med. 2013 Nov 20;32(26):4540-9. doi: 10.1002/sim.5869. Epub 2013 Jun 4. PMID: 23733397.
  • Shuster JJ. Diagnostics for assumptions in moderate to large simple clinical trials: do they really help? Stat Med. 2005 Aug 30;24(16):2431-8. doi: 10.1002/sim.2175. PMID: 15977289.
  • Raab GM, Day S, Sales J. How to select covariates to include in the analysis of a clinical trial. Control Clin Trials. 2000 Aug;21(4):330-42. doi: 10.1016/s0197-2456(00)00061-1. PMID: 10913808.
  • Campbell H, Dean CB. The consequences of proportional hazards based model selection. Stat Med. 2014 Mar 15;33(6):1042-56. doi: 10.1002/sim.6021. Epub 2013 Oct 18. PMID: 24136328.
  • Wood AM, White IR, Thompson SG. Are missing outcome data adequately handled? A review of published randomized controlled trials in major medical journals. Clin Trials. 2004;1(4):368-76. doi: 10.1191/1740774504cn032oa. PMID: 16279275.
  • National Research Council (US) Panel on Handling Missing Data in Clinical Trials. The Prevention and Treatment of Missing Data in Clinical Trials. Washington (DC): National Academies Press (US); 2010. Available from: https://www.ncbi.nlm.nih.gov/books/NBK209904 / doi: 10.17226/12955
  • Dunn G, Maracy M, Tomenson B. Estimating treatment effects from randomized clinical trials with noncompliance and loss to follow-up: the role of instrumental variable methods. Stat Methods Med Res. 2005 Aug;14(4):369-95. doi: 10.1191/0962280205sm403oa. PMID: 16178138.

このシリーズを読む