ヒト臨床試験に潜むサンプリングの落とし穴

アウトライン

作成日: 2025/12/5
更新日: –

はじめに

機能性表示食品のヒト臨床試験 (ヒト試験) では、多くの場合、健常者を対象として「有効性」と「安全性」を評価します。しかし、試験の信頼性を大きく左右する要因のひとつが 研究対象者の選び方 (サンプリング) です。

適切な対象者を定義し、代表性をもったサンプルを確保しなければ、どれほど統計手法が適切でも結果は歪んでしまいます。

ここでは、よくあるサンプリングの問題を、機能性表示食品の文脈に合わせた仮想事例を用いて解説します。

事例: 食後血糖値を改善する機能性食品の研究

ある研究者が、「食後血糖値の上昇を抑える要因を明らかにしたい」というリサーチクエスチョンで横断研究を計画しました。そこで、研究者は都内の大学1校の3年生からボランティアを募り、希望者のみで研究を実施しました。この大学の3年生における男女比は1:1です。

この状況で直面しそうな問題を考えていきましょう。

問1.目的母集団の観点から、このサンプルは適切か？
問2.研究者が、ボランティアバイアスを避けるために上記の大学の3年生全員の25%をランダムに抽出しました。その結果、実際に研究に参加した人の70%が女性でした。この大学の3年生は男女数が同数であるので、サンプリングで明らかな誤差が生じています。この誤差は、どのようなものでるか?

解答・解説

3.1 問1: 目的母集団とサンプルの適切性

以下の理由から、このサンプルは代表性を欠いている可能性が高いと言えます。

目的母集団とサンプルが一致していない

研究目的は「食後血糖値の上昇要因を調べる」ことです。しかし、大学生は一般的に健康で若く、血糖変動が小さく、代謝疾患のリスクも低い集団です。

本来対象とすべき母集団は、

成人全体
あるいは血糖値が高めの層

といった研究目的により適した母集団です。

特定の大学だけでは外的妥当性が低い

食習慣・生活環境・体格は大学によって大きく異なります。特定の大学だけを対象とすると、地域性や生活習慣に起因する偏りが生じ、外的妥当性 (一般化可能性) を損ないます。

ボランティアバイアスの危険

ボランティア方式では、

健康意識の高い人が参加しやすい
食事に興味がある人が集まりやすい
忙しい人 (＝生活が不規則と考えられる人) は参加しない

その結果、本来の母集団とは異なる傾向を持つ参加者が集まりやすくなるため、偏った結果が生じます。

3.2 問2: ランダム抽出後に70%が女性――誤差の正体は？

研究者はボランティアバイアスを避けるため、「大学3年生の25％をランダム抽出」としました。

しかし、実際に調査に参加した人の70％が女性でした。今回の仮想事例における大学の男女比は 1:1であるため、これは明らかに偏っています。

この偏りは偶然によるものか、それともバイアスか？
以下のように検討します。

偶然誤差 (ランダムエラー) の可能性

ランダムサンプリングであれば、偶然のゆらぎで男女比が偏ることはあります。しかし「サンプルサイズが十分に大きい場合」は偏りが小さくなるのが通常です。

いくつかシミュレーションして確認していきましょう。
まずは、理論値から。

男女比は1:1の集団からn人をランダムに抽出するとき、女性が70%以上になる確率は二項分布で求められます。

prob_over70 <- function(n) {
  k <- ceiling(n * 0.7)
  pbinom(k - 1, size = n, prob = 0.5, lower.tail = FALSE)
}

prob_over70(10)
prob_over70(100)

結果は・・・

> prob_over70(10)
[1] 0.171875
> prob_over70(100)
[1] 3.92507e-05

10人を抽出するなら約17%で起こるみたいです。
100人を抽出なら約0.01%未満なので、ほぼ起こらないといっていいですよね。

次にこの抽出する試行を何千回も繰り返し、女性が70%を超える割合をシミュレーションで確認してみましょう。

# モンテカルロシミュレーション
  set.seed(123) # シード値

  simulate_prob <- function(n, p = 0.5, threshold = 0.7, iter = 10000) {
    replicate(iter, {
      x <- rbinom(1, size = n, prob = p)
      x >= ceiling(n * threshold)
    }) |> mean()
  }

  prob_n10  <- simulate_prob(n = 10)
  prob_n100 <- simulate_prob(n = 100)

  prob_n10
  prob_n100

結果は・・・

> prob_n10
  [1] 0.1671
  > prob_n100
  [1] 2e-04

理論値とほぼ同じ結果になりました。
いずれにせよ、女性が70%も含まれるというのは極めて不自然ということですね。

系統誤差 (バイアス) の可能性

サンプルサイズが十分大きい場合に偏りが大きいということは、偶然誤差では説明できず、系統誤差 (バイアス) の関与が濃厚です。

具体的には:

男性より女性の方が研究に協力的
研究内容が女性の関心事に見えた
男性が参加を辞退しやすい環境だった

つまり、研究対象者が「ランダムに抽出された後」にも、参加の意思決定で偏りが発生した可能性が高いといえます。

まとめると、偶然誤差だけでは説明できず、系統誤差が介在していると考えられます。
サンプルサイズが大きいのに70％が女性という偏りは、偶然誤差よりも「参加の偏り (selection bias)」によるものと解釈するのが妥当です。

まとめ

本事例は、機能性表示食品のヒト臨床試験 (ヒト試験) でも非常に重要です。

対象者を適切に定義しない
特定の募集方法で偏った参加者が集まる
若年者や特定属性に偏る

こうした問題が起こると、届出で求められる「健常者における科学的根拠」が弱くなるだけでなく、システマティックレビュー (Systematic Review; SR) や安全性評価において重大な判断ミスが起こり得ます。

機能性表示食品の信頼性は、試験参加者の選定とサンプリングの設計で大きく変わります。

誰を対象にするか
どのように募集するか
なぜその方法が妥当なのか

これらを明確にした試験は、再現性が高く、良いエビデンスといえます。