統計解析.com

統計解析業務の
アウトソーシング

無料相談を
予約する

信頼性の高い測定方法を設計しよう (3)

アウトライン
  1. 作成日: 2025/12/14
  2. 更新日: –

はじめに

機能性表示食品制度では、「科学的根拠に基づく機能性の評価」が必須です。その根拠の質を決める大きな要因の一つが測定方法です。

適切な測定計画は、「機能性があるかどうか」だけでなく「その機能性を正しく証明できるかどうか」 を決定づける極めて重要な要素なのです。

本コラムでは、測定の基礎概念である 定度 (precision)・真度 (accuracy)・妥当性 (validity) を、機能性表示食品の開発場面に合わせて解説します。

事例: 疲労感の軽減を訴求したい

疲労感の改善を主要アウトカムに設定したい研究チームは、次の2項目からなる簡易疲労スケールを独自に作成しました。

  • 「最近、どれくらいの頻度で強い疲労を感じますか?」
  • 「以前より意欲が低下したと感じることはどれくらいありますか?」

しかし、質問票をそのまま使って良いかどうかは「妥当性 (validity)」を確認しなければ判断できません。

妥当性が低い質問票を使用すると、

  • 実際に存在する改善を正しく捉えられない
  • 研究結果の信頼性が下がる
  • 消費者庁への届出資料として根拠不足になる

といった重大な問題が発生します。

そこで、研究チームは妥当性を検証するためにいくつかの観察データを収集しました。

その結果・・・

  • 疲労スコアが高い人ほど、その後の欠勤・医療受診が多かった
  • 専門家レビューで、質問内容が疲労感の測定に適切と評価された
  • 忙しい時期にスコアが上昇し、休日には低下した
  • 標準的に使用される疲労度尺度と強い相関があった

それぞれの記述は、どのような妥当性に該当するか考えてください。

解答・解説

3.1 「a. 疲労スコアが高い人ほど、その後の欠勤・医療受診が多かった」

  • 分類
    予測的妥当性 (predictive validity)
  • 解説

    疲労スコアが高い人ほど、その後に欠勤や医療受診といった「疲労に関連する事象」が増えていたことから、このスコアには 将来の出来事を予測する力があると考えられます。

    これは、アウトカムとなる現象との関連性を事前に予測できているかを示す

    予測的妥当性 (predictive validity) の典型例です。

    機能性表示食品の文脈では、たとえば「疲労感スコアが高い人ほど日常生活動作の低下が見られる」といった関連が確認されれば、指標としての信頼性が高まり、「疲労軽減」を訴求する際の科学的根拠として非常に重要な意味をもつと思います。

3.2 「b. 専門家レビューで、質問内容が疲労感の測定に適切と評価された」

  • 分類
    表面的妥当性 (face validity)
  • 解説

    専門家が項目内容を確認した際に、「この質問は確かに疲労感を測定している」と直感的に判断できるかどうか を評価するものです。

    科学的な裏付けというより内容の妥当性を見た目でチェックする段階ですが、質問票を開発する初期フェーズでは欠かせない重要なプロセスです。

3.3 「c. 忙しい時期にスコアが上昇し、休日には低下した」

  • 分類

    構成概念妥当性 (construct validity)

  • 解説

    疲労という概念が、本来示すはずの変化と理論的に一致した動きを示しているかを確認する妥当性です。忙しい時期にはスコアが上昇し、休日には低下するといった挙動が見られる場合、その質問票は疲労という概念を適切に捉えていると判断できます。

    機能性表示食品の実務では、ストレス、腸内環境、睡眠の質、気分状態など、主観尺度を扱う場面が多く、これらの評価では構成概念妥当性の確認がとくに重要となります。

3.4 「d. 標準的に使用される疲労度尺度と強い相関があった」

  • 分類

    基準関連妥当性 (criterion-related validity)

  • 解説

    既に信頼性が確立している標準的な疲労尺度という外部基準 (criterion) とどれだけ一致しているかを評価する妥当性です。

    強い相関が認められれば、その質問票も同様の概念を正しく測定できている可能性が高いと判断できます。

    機能性表示食品の届出においては、外部基準との整合性が示されている指標ほど、科学的根拠としての説得力が高まるため、重要なエビデンスの一つとなります。

まとめ

機能性を評価する研究では、質問票を自作したり、短縮版・簡易版の尺度を採用することも少なくありません。

しかし、妥当性が確認されていない尺度を用いると、実際には存在する効果であっても検出できない という深刻な問題が生じます。

妥当性は、次の4つの観点から総合的に評価します。

  • 予測的妥当性: 将来のアウトカムをどれだけ予測できるか
  • 表面的妥当性: 項目内容が直感的に適切と判断できるか
  • 構成概念妥当性: 理論的に期待される変化を示しているか
  • 基準関連妥当性: 標準的な尺度と一致しているか

機能性表示食品の届出では、「使用した評価指標が科学的に妥当であるか」の説明が強く求められており、この妥当性評価は、研究結果の信頼性と説得力を支える最重要ステップの一つです。

関連するサービス

このシリーズを読む