JAMAガイドラインに沿って作る統計解析計画書 (Section 5)
- アウトライン
-
- 作成日: 2025/12/6
- 更新日: –
はじめに
統計解析計画書 (Statistical Analysis Plan; SAP) は、ヒト臨床試験 (ヒト試験) のプロトコルに記載された解析方針を、より技術的かつ詳細に記述した文書です。
本稿は、JAMAにてGamble C, et al (2017) が示したガイドラインに沿ってSAPを作成する方法をまとめます。
SAPの基本的な概要は以下のコラムにまとめているので、興味がある方は、画像をクリックして読んでいただけると幸いです。
SAPのチェックリスト
Section 5のチェックリストは以下の通りです:
表1. 「Section 5: 母集団 [Trial Population]」のチェックリスト
| Section/Item | Index | Description |
|---|---|---|
| スクリーニングデータ | 21 | 試験サンプルの代表性を示すスクリーニングデータ (収集されている場合) の報告 |
| 適格性 | 22 | 資格基準の概要 |
| 募集 | 23 | CONSORTのフロー図に含まれるべき情報 |
| 脱落/フォローアップ | 24a | 介入および/またはフォローアップからの撤退のレベル |
| 24b | フォローアップデータの撤回/喪失のタイミング | |
| 24c | 離脱/追跡調査不能のデータをどのように提示するかの理由と詳細 | |
| ベースライン特性 | 25a | 要約されるベースライン特性のリスト |
| 25b | ベースラインの特性がどのように記述的に要約されるかの詳 | |
| アウトカムの定義 | 以下の詳細を含む、各主要および副次的な結果を記載し、説明すること。 | |
| 26a | 結果と時期の指定 | |
| 26b | 具体的な測定方法と単位 (例: グルコースコントロール hbA1c (mmol/mol又は%))。 | |
| 26c | 結果を得るために使用した計算又は変換 (例: ベースラインからの変化、生活の質 (QoL) スコア、イベント発生までの時間、対数等)。 |
Gamble C, et al (2017) から引用、改変
次の章から、このチェックリストに沿って、どのようにSAPを書いていくか紹介します。
SAPを作成する
3.1 スクリーニングデータ [Screening Data]
Item 21: スクリーニングデータの報告
(収集している場合は) スクリーニングデータを報告し、試験参加者が全体の対象集団をどの程度代表しているかを説明する。
試験でスクリーニングデータを収集する場合、これらのデータを適切に提示し、試験参加者が母集団をどの程度代表しているかを明確に示すことが重要です。この情報は、当該試験の解釈に有用であるだけでなく、将来同領域で実施される試験にとっても価値が高くなります。
試験参加者のスクリーニング方法および収集するデータ項目については、試験実施計画書 (プロトコル) に明確かつ十分に記述されるべきです。CONSORTガイドラインでは、最低限、適格性評価を受けた試験参加者数をフローダイアグラムで提示することが求められていますが、より詳細なスクリーニングデータの要約を提示することも推奨されます。
SAPには、スクリーニングデータをどのように要約し、どの形式 (例: 表、グラフ、フローダイアグラム) で提示するかを明確に規定する必要があります。
<記載例>
スクリーニングを受けたすべての参加候補者について、以下の情報を要約して報告する:
- 募集期間 (日数)
- スクリーニング実施者数
- 登録 (組み入れ) された参加者数
- 1日あたりの登録数
- スクリーニングを通過しなかった者の人数
- スクリーニング不合格 (未組み入れ) の理由
これらの情報は、全体および試験実施施設ごとに集計して提示する。
<記載例>
本試験では、対象となり得る一般消費者 (または試験参加者候補者) の総数は収集していない。これは、対象者全数の把握に相応のリソースを要し、得られるデータの正確性や信頼性が十分に担保できないと判断したためである。
3.2 適格性 [Eligibility]
Item 22: 適格性の要約
適格性の要約を記載する。
試験の組み入れ基準 (適格基準) および除外基準は、プロトコルに明確に記載する必要があります。また、適格性に関するデータをどのように要約し提示するかについても、SAPで具体的に規定すべきです。
CONSORTフローダイアグラムの一部では、以下のような詳細を提示する例があります:
- スクリーニングを受けた試験参加者数
- 適格であった試験参加者数
- 各組み入れ基準/除外基準に違反したため除外された試験参加者の内訳
このような情報は、試験参加者の選択過程を透明にし、試験集団の代表性や外的妥当性を評価するうえで有用です。
<記載例>
組み入れ後に、試験の参加基準に適合していないことが判明した試験参加者がいた場合は、その人数および不適合の理由を報告する。
3.3 募集 [Recruitment]
Item 23: 募集
CONSORTフロー図に含めるべき情報を明記する。
CONSORTフローダイアグラムには、すべての参加者の試験経過を時系列で示す情報が含まれます。CONSORTガイドラインでは、「CONSORT 2010基準に準拠するためには、フローダイアグラムの作成が必要である」と明記されています。
SAPには、フローダイアグラムに表示すべき情報をすべて記載し、試験参加者のスループット (screening → enrollment → allocation → follow-up → analysis) がどのように要約されるのか、また各フォローアップ時点が離脱や追跡不能 (lost to follow-up) の情報とともに表示されるかどうかを明確に規定する必要があります。
さらに、試験で特に重視するデータを反映した、試験固有のCONSORTフローダイアグラムのテンプレートをSAPに含めることも可能です。
<記載例>
本試験では、参加者のスクリーニングから解析までの流れをCONSORTフロー図に準じて整理し、以下の項目について全体および施設別に人数を報告する。
- スクリーニング人数、適格/不適格 (理由)
- 組み入れ人数、組み入れ不可 (理由)
- 割付または群分けされた人数
- 介入開始/中止 (理由)
- フォローアップ完了/不能 (理由)
- 解析対象集団に含まれた人数、除外人数 (理由)
これにより、試験参加者の流れの透明性と信頼性を確保する。
3.4 脱落/フォローアップ – 脱落の程度 [Withdrawal/Follow-up – level of withdrawal]
Item 24a: 脱落の段階 (分類)
どのレベルで試験参加者が離脱したのかを分類して示す
本セクションでは、試験ごとに設定され得るすべての離脱レベルを明確に列挙する必要があります。参加者は、以下のように複数の段階で離脱し得ます:
- 介入 (治療) からは離脱するが、フォローアップは継続する
- フォローアップから離脱するが、これまでに収集されたデータの使用は許可する
- フォローアップから離脱し、既収集データの使用に対する同意も撤回する
- 連絡不能となり、フォローアップできなくなる (lost to follow-up)
SAPでは、これら各レベルの離脱をどのように分類し、どのように結果において提示するか (例: CONSORTフローダイアグラム、試験参加者状況表、個票リスティングなど) を明確に規定することが重要です。
<記載例>
同意撤回の状況について、以下の区分で集計し報告する:
- 試験への参加は中止するが、追跡調査およびデータ収集には同意した場合
- 来院 (または追跡調査) は中止するが、これまでに収集されたデータの利用には同意した場合
- 追跡調査もデータ利用も中止 (同意撤回) した場合
Item 24b: 脱落の時期
どの時点で試験参加者が試験から脱落 (withdrawal) したか、そのタイミングに関するデータの報告方法を明記する。
離脱や追跡不能のタイミングは、試験データの解釈において重要な情報です。この情報により、特定の時点や治療群間で離脱や追跡不能に一定のパターンが存在するかどうかを評価できます。
追跡中止または追跡不能となった時期は、Kaplan–Meier曲線、要約表、あるいはCONSORTフローダイアグラムに組み込んで提示することが可能です。さらに、各フォローアップ時点について、以下の情報を提供することが望ましいです:
- 脱落者数
- 脱落理由
- 解析対象に含まれた試験参加者数
- 死亡数 (該当する場合)
このような詳細な情報により、試験集団の推移が明確になり、解析結果の妥当性をより適切に評価できます。
<記載例>
各評価時点 (例: ベースライン、4週間、8週間、12週間) において、解析から中止または除外された試験参加者の人数と、その理由を明確に示す。
Item 24c: 脱落理由の提示
脱落 (withdrawal) や追跡不能 (lost to follow-up) がなぜ起きたのか (理由) と、そのデータをどのような形で提示・集計するのか (方法) を説明する
離脱理由には、たとえば自宅への引っ越し、個人的事情による参加不能、臨床医の都合による継続不可などが挙げられます。
治験チームにとって、すべての離脱および追跡不能の理由を把握することは重要である。ICH E6では、「試験参加者が試験を早期に中止する理由を説明する義務はないが、治験責任医師は試験参加者の権利を十分に尊重しつつ、その理由を確認するため合理的な努力を行うべきである」と規定されています。
これらの離脱理由は、介入群別にCONSORTフローダイアグラムまたは表形式で提示することができます。
<記載例>
試験期間中にフォローアップ不能 (脱落など) となった試験参加者については、その人数および理由を、摂取群ごとに集計して報告する。
3.5 ベースラインの試験参加者の基本情報 [Baseline patient characteristics]
Item 25a: ベースライン特性のリスト
ベースライン特性として要約・提示すべき項目の一覧を示す。
試験群ごとのベースライン特性の提示は、介入群間で試験参加者背景が均衡しているかを読者が確認できるようにするため、すべての試験において極めて重要です。
そのため、最終報告書 (Clinical Study Report; CSR) でどのベースライン特性を要約・提示するかについて、SAPに明確に記載しておく必要があります。
また、無作為化 (ランダム化) が層別化あるいは最小化によって実施された場合、その因子は必ずベースライン特性として含め、群間のバランスが示されるようにすることが望ましいです。
<記載例>
試験参加者のベースライン特性として、年齢、性別、BMI、生活習慣 (例: 喫煙状況・運動習慣)、既往歴および現在の健康状態、対象となる指標のベースライン値などを、全体および摂取群別に要約して提示する。
Item 25b: ベースライン特性のリスト
ベースライン項目をどういう統計量で、どうやってまとめるのかを決めて記載する。
最終解析報告書において、ベースライン特性をどのように要約し提示するかを事前に明確に規定することは重要です。一般に、無作為化群間のベースライン特性について正式な統計学的比較を行うことは推奨されません。比較を計画する場合には、その妥当性および必要性を事前に正当化しておくことが求められます。
また、予後に関連するベースライン特性については、主要転帰の一次解析に含まれる解析集団だけでなく、無作為化された全参加者についても提示することが推奨されます。これは、離脱により選択バイアスが生じていないか、または無作為化により確保された群間バランスが維持されているかを評価するためです。
<記載例>
カテゴリデータは、人数およびパーセンテージで要約する。連続データは、分布が正規に近い場合は平均値・標準偏差・範囲を、分布が歪んでいる場合は中央値・四分位範囲・範囲を用いて要約する。また、連続データについては最小値および最大値も併せて示す。ベースライン特性については、介入群間で統計学的な有意差検定は行わず、必要に応じて群間の不均衡が臨床的に意味を持つかどうかを記載する。
3.6 アウトカムの定義 [Outcome definitions]
Item 26a, 26b, 26c: アウトカムの詳細
主要および副次アウトカムについて、それぞれの内容および以下の事項を記載する:
(26a)アウトカムの定義と評価時点
(26b)測定方法および単位
(26c)アウトカム算出に用いる計算や変換 (例: ベースラインからの変化量、QOLスコア、イベント発生までの時間、対数変換など)。
SAPでは、各アウトカムを明確に定義し、主要アウトカムおよび副次アウトカムを明確に区別することが必須です。複数の主要アウトカムを設定する場合には、ICH E9 (2.2.5 複数の主要変数 [Multiple Primary Variables]) で示されている検討事項を踏まえ、解釈に関する指針を示すとともに、Item 17で定義した多重性調整の方法との整合性を確保する必要があります。
また、アウトカムが複数の時点で測定される場合には、特定のアウトカムとしてどの時点のデータを使用するのかを明確に記述することが求められます。例えば、生存時間を主要アウトカムとする場合には、生存時間の定義 (無作為化時点から算出するのか、または介入開始時点から算出するのか)、打ち切り (censoring) に関する取り扱いなどの詳細も記載すべきです。
SAPでは、各アウトカムに対応する測定変数および必要に応じた測定単位 (例: 全生存期間〔日〕) を明確に特定し、統計担当者が実施するデータ操作や導出方法の詳細を記載する必要があります。特に、どのようなデータ操作・導出処理を、どの方法で行うかを具体的に示すことが求められます。
これは、データ収集時の単位や形式が異なる場合に重要です。たとえば、HbA1cが%で記録されている場合とmmol/molで記録されている場合、あるいはQOL指標のスコア体系が異なる場合などが該当します。
スコア計算が複雑であっても、確立されたアルゴリズムが存在する場合には、参考文献およびアルゴリズムへのリンクを示せば十分です。さらに、欠測値の取り扱いも含め、スコアリングの方法は、特段の正当な理由がない限り、測定機器またはスケール開発者が推奨する手法に従うべきです。
読者が各アウトカムのスコア・値がどのように算出されるのかを理解できるよう、十分な記述の詳細性を確保しましょう。
<記載例>
睡眠日誌およびアクチグラフから算出する睡眠関連アウトカムについては、ベースライン期間 (例: 試験開始前7日間) において、少なくとも5日分の有効データを収集する。また、試験終盤の評価期間 (例: 試験開始後〇週目の7日間) においても、少なくとも5日分のデータを確保するものとする。
<記載例>
夜間の総睡眠時間 (睡眠日誌による算出)
1晩の総睡眠時間は、就寝時刻から翌朝の起床時刻までの時間から、夜間に覚醒していた時間を差し引いて算出し、分単位で記録する。ベースライン値は、試験開始前の7日間の総睡眠時間 (有効データ5日以上) の平均値を用いる。介入後の評価値は、試験終了前の7日間 (例: 試験12週目の評価前1週間) の総睡眠時間 (有効データ5日以上) の平均値を用いる。両期間とも、7日間のうち5日以上の記録が得られた場合に限り、主要アウトカムの解析に使用する。いずれかの期間で有効データが5日未満の場合、その期間のデータは欠測として扱い、当該試験参加者は当該アウトカムの主要解析には含めない。
まとめ
本稿は、JAMAに掲載されたGamble C, et al (2017) のガイドラインをもとに、統計解析計画書 (Statistical Analysis Plan; SAP) のSection 5: 母集団 (Trial Population) の作成方法を整理しました。
Section 5は、「試験に誰が入り、どこで離脱し、最終的に誰のデータが解析に使用されたか」を明確にする章です。
これは試験の透明性・信頼性を高める根幹となる部分であり、適格性・募集状況・脱落・ベースライン・アウトカム定義を体系的に記述することで、解析結果の妥当性と再現性を担保できます。
特に機能性表示食品のヒト臨床試験 (ヒト試験) では、医薬品の臨床試験 (治験など) と異なりデータ品質のばらつきが生じやすいため、SAPの段階でこれらのルールを厳密に定義しておくことが最終的なエビデンスの質を決定づけることになります。
参考文献
- Gamble C, Krishan A, Stocken D, Lewis S, Juszczak E, Doré C, Williamson PR, Altman DG, Montgomery A, Lim P, Berlin J, Senn S, Day S, Barbachano Y, Loder E. Guidelines for the Content of Statistical Analysis Plans in Clinical Trials. JAMA. 2017 Dec 19;318(23):2337-2343. doi: 10.1001/jama.2017.18556. PMID: 29260229.
- Schulz KF, Altman DG, Moher D; CONSORT Group. CONSORT 2010 statement: updated guidelines for reporting parallel group randomised trials. BMJ. 2010 Mar 23;340:c332. doi: 10.1136/bmj.c332. PMID: 20332509; PMCID: PMC2844940.
- Hopewell S, Chan AW, Collins GS, Hróbjartsson A, Moher D, Schulz KF, Tunn R, Aggarwal R, Berkwits M, Berlin JA, Bhandari N, Butcher NJ, Campbell MK, Chidebe RCW, Elbourne D, Farmer A, Fergusson DA, Golub RM, Goodman SN, Hoffmann TC, Ioannidis JPA, Kahan BC, Knowles RL, Lamb SE, Lewis S, Loder E, Offringa M, Ravaud P, Richards DP, Rockhold FW, Schriger DL, Siegfried NL, Staniszewska S, Taylor RS, Thabane L, Torgerson D, Vohra S, White IR, Boutron I. CONSORT 2025 statement: updated guideline for reporting randomised trials. BMJ. 2025 Apr 14;389:e081123. doi: 10.1136/bmj-2024-081123. PMID: 40228833; PMCID: PMC11995449.
- Senn S. Testing for baseline balance in clinical trials. Stat Med. 1994 Sep 15;13(17):1715-26. doi: 10.1002/sim.4780131703. PMID: 7997705.





