Rを用いて統計的仮説検定を学ぶ (1)
- アウトライン
-
- 作成日: 2026/1/21
- 更新日: –
はじめに
統計解析では、手元のデータが「どのような前提で得られたものか」、そして「どの範囲まで一般化してよいのか」を常に意識する必要があります。
平均値の比較、相関の評価、カテゴリデータの関係性の検討など、見た目は異なる解析手法であっても、根底にある目的は共通しています。それは、偶然によるばらつきと、意味のある差・関係を見分けることです。
本コラムでは、統計の基本として重要な2群間比較 (検定) や相関解析のうち、まずは「1標本t検定」を取り上げます。
機能性表示食品のヒト臨床試験 (ヒト試験) でも頻出する「平均との差が偶然かどうか?」という発想を、Rの実行例を通して確認していきます。
問題
ある国の20歳男性の体重は、平均65 kgの正規分布に従うことが知られているとします。
次の 20人分の体重データ (kg) は、この国の20歳男性の体重に関する母集団からの無作為標本と考えてよいでしょうか?
Rの t.test() を用いて検定してください。
60, 52, 65, 63, 58, 66, 62, 72, 54, 57,
59, 60, 61, 67, 55, 58, 64, 69, 56, 62
- ヒント
-
- ・帰無仮説: 母平均は65 kgである
- ・対立仮説: 母平均は65 kgではない
解答
【スクリプト】
体重 <- c(60, 52, 65, 63, 58, 66, 62, 72, 54, 57,
59, 60, 61, 67, 55, 58, 64, 69, 56, 62)
t.test(体重, mu = 65)
【出力】
One Sample t-test
data: 体重
t = -3.4596, df = 19, p-value = 0.002625
alternative hypothesis: true mean is not equal to 65
95 percent confidence interval:
58.58001 63.41999
sample estimates:
mean of x
61
解説
今回の標本平均は約61 kgで、母平均65 kgより小さくなっています。
さらに、p値は0.002625と十分に小さく、一般的な有意水準5% (0.05) で考えると、「母平均は65kgである」という仮説は棄却されます。
また、95%信頼区間は58.58 ~ 63.42 kgであり、65 kgを含んでいない点も重要です。このことは「真の平均が65 kgである」可能性が低いことを、別の角度から裏づけています。
つまり今回のデータは、少なくとも「平均65kgの母集団から得られた無作為標本」とみなすには違和感があるという結論になります。
まとめ
本コラムでは、1標本t検定を題材に、統計検定の基本的な考え方を確認しました。
- 「平均との差」が偶然のぶれで説明できるか?をp値で評価する
- p値が小さい → 偶然では説明しにくい → 帰無仮説を棄却
- 信頼区間に母平均が含まれるかも、結果の理解に役立つ
機能性表示食品のヒト臨床試験 (ヒト試験) でも、「基準値 (既知の平均) と比べてどうか」「平均との差が偶然かどうか」を考える場面は多くあります。
本稿が、統計結果を正しく読み解くための足場になれば幸いです。Rを使った他のクイズ形式の問題は、他のコラムでもまとめています。ぜひあわせてチェックしてみてください。





