VO2maxを主要アウトカムとした臨床試験は成立するか?
- アウトライン
-
- 作成日: 2026/1/16
- 更新日: –
はじめに
ヒト臨床試験 (ヒト試験) の主要アウトカムとして設定される指標は、その試験の「価値」を決定づける核心です。一般的には、死亡、再発、症状スコア、バイオマーカーなどが主要アウトカムとして用いられます。
一方で、最大酸素摂取量 (VO2max) や呼吸商 (Respiratory quotient; RQ) といった運動生理学的指標が、主要アウトカムとして採用される例は決して多くありません。VO2maxは以下の式で定義される生理学的に明確な指標です。
にもかかわらず、主要アウトカムとしては「ばらつきが大きい」「解析が難しい」といった理由で敬遠されがちです。
本稿では、VO2maxを主要アウトカムとして正式に位置づけた稀有なランダム化比較試験であるEnergy Balance and Breast Cancer Aspects-II (EBBA-II) 試験の統計解析計画書 (SAP) を読み解きながら、
- なぜVO₂maxが主要アウトカムとして成立したのか
- どのように統計的に扱われているのか
- 機能性表示食品の試験設計に何を示唆するのか
を整理します。
EBBA-II試験とは?
EBBA-II試験は、乳がん術後補助療法を受ける患者を対象に、12か月間の運動介入と標準治療を比較する、ランダム化・評価者盲検・並行群間比較試験です。
| 試験名 | Energy Balance and Breast Cancer Aspects-II |
|---|---|
| 試験登録 | ClinicalTrials.gov (NCT02240836) |
| 試験責任機関 | Oslo University Hospital (ノルウェー) |
| 試験デザイン | ランダム化、評価者盲検、並行群間比較、優越性試験 |
| 割付 |
1:1 |
| 対象集団 | 新規診断乳がん患者 (術後補助療法中) |
| 介入 | 12か月間の運動プログラム |
| 対照 | 標準治療 (身体活動の制限なし) |
| 主要アウトカム | VO2maxのベースラインから12か月後までの変化量 |
| 評価時点 | ベースライン、6か月、12か月 (+長期追跡: 2・3・5・10年) |
介入の目的は単なる体力向上ではなく、運動介入が心肺機能・代謝プロファイル・腫瘍微小環境に及ぼす影響を、包括的に検証することにあります。
VO2maxが「主要アウトカム」に採用された理由
興味深い点は、EBBA-II試験においてVO2maxは当初から主要アウトカムとして設定されていたわけではないということです。
ClinicalTrials.govの初期登録時点では、主要アウトカムとして設定されていたのは、
- 脂質・リポ蛋白
- 血糖
- 血圧
- 体組成
- インスリン
- 炎症・血栓関連マーカー
といった、いわゆる「代謝プロファイル」でした。
一方、VO2maxを含む心肺機能指標 (Car- diopulmonary exercise test (CPET) 関連指標) は副次的アウトカムとして位置づけられていました。
しかし試験の進行とともに、乳がん補助療法中の患者において、
- 心肺機能の低下が臨床的に重要な問題であること
- 運動介入の直接的な効果を最も統合的に反映する指標がVO2maxであること
が明確になったようです。
その結果、多様な代謝指標を個別に評価するよりも、心肺機能の包括的指標であるVO2maxの変化量の方が、臨床的意義および解釈の一貫性に優れると判断されました。
この判断を受けて、データ固定前に、
- 主要アウトカムを「VO2maxのベースラインから12か月後までの変化量」に再定義
- 統計解析計画書 (SAP) を改訂
- ClinicalTrials.gov の登録内容を更新
- VO2maxを主要アウトカムとした検出力・症例数の再評価を実施
という一連の手続きが行われました。
このプロセスは、
- データロック前に実施されていること
- SAPの改訂履歴が明示されていること
- 主要アウトカム変更に伴い統計的検出力の再計算が行われていること
から、ICH E9やCONSORTの考え方に照らしても許容される、方法論的に正当な手続きです。
したがって本試験における主要アウトカムの変更は、「結果を見て都合よくエンドポイントを差し替えた」ものではなく、試験の科学的焦点をより本質的な臨床指標へと再整理した設計上の意思決定と位置づけることができます。
ここまでを整理すると・・・
EBBA-II試験では、代謝指標 (脂質・血糖など) は運動介入の「間接的結果」、VO2maxは運動介入の「直接的かつ統合的効果」と再整理されました。
これはそのまま、機能性表示食品にも当てはめられます。つまり、食品の作用機序がエネルギー代謝・運動耐容能に関係する場合は、VO2maxは、代謝指標よりもむしろ直接的な指標になり得ると思います。
EBBA-II試験でVO2maxはどのように解析されたか?
4.1 主要アウトカムの定義
EBBA-II試験における主要アウトカムは、VO2maxのベースラインから12か月後までの変化量を連続変数として評価と定義されています。
VO2maxを連続変数として扱うことで、
- 生理学的情報量を最大限に保持
- 二値化による検出力低下を回避
- 群間差の大きさを定量的に解釈可能
という利点が確保されています。
4.2 統計モデルの設計思想
EBBA-II試験では、主解析に線形混合モデル (Linear Mixed Model) が用いられています。これは、VO2maxが縦断的に繰り返し測定される連続指標であることを前提とした設計です。
モデルには以下の固定効果が含まれています。
- 群 (運動介入群 vs 標準治療群)
- 時点 (0,6,12か月)
- 群と時点の交互作用
- 閉経状態 (ランダム化時の層別因子)
また、ランダム効果 (Random effects) として、被験者ごとのランダム切片が導入されています。これにより、被験者間の初期VO2maxのばらつき、同一被験者内での測定値相関が適切にモデル化されています。
また、時間は6か月を折れ点 (ノット) とするpiecewise linear (区分線形) としてモデル化されており、0–6か月と6–12か月で異なる変化傾向を許容する設計となっています。
これは、
- 介入初期 (0–6か月)
- 介入後期 (6–12か月)
でVO2maxの変化速度が異なる可能性を事前に想定したものであり、運動介入研究として合理的な仮定だと思いました。
4.3 解析設計の統計的意義
この解析設計により、
- 欠測を含む縦断データを自然に扱える
- modified ITT原則を維持できる
- 6か月時点の情報も活用でき、推定効率が高い
といった利点が得られます。これは、いわゆるMixed Model for Repeated Measures (MMRM) やconstrained longitudinal data analysis (cLDA) に近い形です。
4.4 VO2maxを主要アウトカムとしたサンプルサイズ設計
EBBA-II試験では当初、主要アウトカムを代謝プロファイルと想定し、それらをもとに症例数設計が行われていました。
しかし、試験進行中にVO2maxが主要な関心変数として再定義されたことを受けて、VO2maxを主要アウトカムとした再設計が行われています。
SAP では,以下の仮定が明示されている。
- ベースラインのVO2max: 両群とも約32 mL/kg/min
- 12か月後の変化: 運動介入群 [変化なし (0)] / 標準治療群 [−0.5 mL/kg/minの低]下
- 群間差: 0.5 mL/kg/min
- 変化量の標準偏差: 2.0
- 有意水準: 両側 5%
- 検出力: 80–86%
この前提のもと、1群あたり約253例で80%の検出力が確保できると算定され、1群あたり約300例という目標症例数が設定されました。検出力を逆算すると、86%になります。
ここで、重要なのは・・・
VO2maxの標準化効果量が決して大きくないということです。
しかし、連続変数として扱い、縦断情報を最大限活用し、適切な混合モデルを用いることで、現実的な症例数で検証可能な設計が成立しています。
これは、VO2maxは「ばらつきが大きいから主要アウトカムにできない」のではなく、「適切なモデルと設計を前提にすれば成立する」ことを示しています。
呼吸商 (Respiratory quotient; RQ) はなぜ主要アウトカムではないのか?
EBBA-II試験では、RQも測定されていますが、副次・補足的アウトカムという位置づけです。
RQは、
- 食事内容
- 測定条件
- 直前の運動負荷
に強く影響されるため、臨床的「意味づけ」がVO2maxより曖昧だったのでは?と思いました。
そのため、生理学的には重要でも、主要アウトカムとしての再現性は低いと判断されたと考えられます。
機能性表示食品試験への示唆
EBBA-II試験は、健常者に対する機能性表示食品のヒト臨床試験 (ヒト試験) ではありません。
しかし、VO2maxを主要アウトカムとして成立させた数少ない成功例であり、以下の示唆を得られました。
① VO2maxは「条件付きで」主要アウトカムになり得る
主な条件として以下の3つがあげられます。
- 対象が心肺機能の低下が臨床的に問題となる集団
- 介入が心肺機能改善と直接的に結びつく合理性を持つ
- 統計設計が縦断・混合モデル前提で組まれている
この条件が揃えば、VO2maxは立派な主要アウトカムになり得ます。
② 機能性表示食品のヒト臨床試験 (ヒト試験) で難しい理由も明確
機能性表示食品のヒト臨床試験 (ヒト試験) では、
- 症状・イベントとの直接的関連が弱い
- 「臨床的意義」の説明が難しい
ため、VO2maxは副次アウトカムに留まる場合も散見されます。
まとめ
本稿では、VO2maxを主要アウトカムとして正式に採用した稀有なランダム化比較試験であるEBBA-II試験を題材に、「VO2max は主要アウトカムとして成立し得るのか?」という問いを検討してきました。
EBBA-II試験の最大の特徴は、VO2maxを主要アウトカムとして「選んだ」ことではなく、その選択に至るまでの過程と、それを支える統計設計が極めて丁寧であった点にあります。
試験当初は、脂質・血糖・体組成などの代謝プロファイルが主要アウトカムとして想定されていましたが、試験進行中に、
- 運動介入の効果を最も直接的かつ統合的に反映する指標は何か
- 多数の代謝指標を個別に評価することの限界
が再検討され、VO2maxが主要な関心変数として再定義されました。この変更は、データロック前に実施され、SAP改訂と症例数再計算を伴う正当な手続きとして行われています。
さらに、VO2maxは、
- 連続変数として扱われ
- 縦断データを前提とした線形混合モデル (MMRMに準じる設計) で解析され
- 効果量が大きくない前提でも、現実的な症例数で検証可能な設計
が構築されていました。
これらは、「VO2maxはばらつきが大きいから主要アウトカムにできない」という通念が、設計と解析の工夫によって克服可能であることを示しています。
一方で、同じ運動生理学的指標である呼吸商 (RQ) は、測定条件や食事の影響を強く受け、解釈の一貫性に課題があることから、主要アウトカムではなく副次・補足的指標に留められていました。この点も、「何を主要アウトカムにすべきか」を考えるうえで重要な対照例です。
EBBA-II試験は疾病者が対象である試験であり、そのまま機能性表示食品のヒト臨床試験 (ヒト試験) に適用できるわけではありません。
しかし、
- 介入の作用機序とアウトカムの対応関係
- 多指標評価と単一統合指標のトレードオフ
- 主要アウトカムとして成立させるための統計設計の条件
という観点において、VO2maxをどう位置づけるべきかを考えるための強力な参照枠を提供しています。
結論として、VO2maxは万能な主要アウトカムではありませんが、適切な文脈・合理的な作用機序・縦断解析を前提とした設計が整えば、主要アウトカムとして十分に成立し得る指標であることを、EBBA-II試験は示しています。
機能性表示食品や探索的ヒト試験において、VO2max、CPET指標、呼吸商 (RQ) をどのように位置づけるかを検討する際、このコラムを思いだしていただけると幸いです。
参考文献
- Energy Balance and Breast Cancer Aspects (EBBA-II). ClinicalTrials.gov identifier: NCT02240836. Available at: https://clinicaltrials.gov/study/NCT02240836 (Accessed 2026-01-16).
- 厚生労働省. ICH E9 臨床試験のための統計的原則 (2026年1月16日アクセス可能: https://www.pmda.go.jp/files/000156112.pdf)