「ゼロからわかる!実用統計学講座」

難しい理論より実践的な知識を最短で学びたい方のための統計学


第1回 「この差は本当に意味があるの?」

統計学は、データから何かを判断するための道具です。

たとえば、新しいダイエット方法を試した2つのグループがあるとします。グループAは平均3kg痩せ、グループBは平均2.5kg痩せました。この0.5kgの差は、本当にダイエット方法の効果によるものなのでしょうか?それとも、単なる偶然でしょうか?

この「偶然ではなさそうだ」と判断するための考え方が、今回お話しする統計的検定です。


P値とは何か?

統計的検定の中心となるのがP値(ピーち)です。P値とは、簡単に言うと「偶然によって、今見ている結果(あるいはそれ以上に極端な結果)が得られる確率」を表します。

もし、先ほどのダイエットの例で、P値が0.05だったとします。これは「この2つのグループに効果の差が全くないにもかかわらず、偶然によって0.5kg以上の差が生まれる確率は5%である」ことを意味します。

このP値が小さいほど、その差は偶然ではない、つまり「意味のある差」である可能性が高いと考えられます。

一般的に、P値が0.05(5%)以下であれば、「統計的に有意な差がある」と判断することが多いです。これは、5%以下であれば、偶然の可能性は低いと見なす、という社会的な慣習のようなものです。この0.05という基準は、有意水準と呼ばれます。

重要な注意点

P値が0.05以下であっても、その差が「医学的に意味がある」「ビジネス的に重要である」とは限りません。P値はあくまで統計的な判断基準であり、実用的な意味は別途考慮する必要があります。


検定とP値の実際の計算方法

P値の計算には、Excelや統計ソフトを使います。基本的なステップは以下の通りです。

  1. 帰無仮説を立てる
    「2つのグループの間に差はない」という、否定したい仮説を立てます。これを帰無仮説と呼びます。
  2. 適切な統計手法を選ぶ
    比較するデータの種類(数値データ、カテゴリデータなど)やグループの数によって、適切な検定手法を選びます。代表的なものに、2つのグループの平均値を比較するt検定などがあります。
  3. 統計ソフトでP値を計算する
    Excelなどのソフトウェアにデータを入力し、選んだ検定手法を使ってP値を計算します。

学会発表や論文での表現方法

研究論文では、P値を使って結果を客観的に報告します。以下の2つの表現を覚えておきましょう。

  1. P値そのものを記載する
    「〇〇と〇〇の間には統計的に有意な差が認められた(t = 2.5, P = 0.012)」のように、P値の具体的な数値を記載します。これにより、読者は判断の根拠を正確に把握できます。
  2. 記号で表現する
    表やグラフの中で、「*(アスタリスク)」などの記号を使って有意差を示すこともあります。
    • p < 0.05:*
    • p < 0.01:**
    • p < 0.001:***
    このような記号を用いる際は、注釈として、それぞれの記号が示すP値の範囲を明記しましょう。

NGな表現の例

「P値が0.05より小さかったので、帰無仮説は真である」のような表現は誤りです。あくまで「帰無仮説を棄却する」のであって、証明するわけではありません。

本日のまとめ

P値は、「偶然によってその結果(またはそれ以上に極端な結果)が得られる確率」です。

P値が小さいほど、偶然ではない(=意味のある)差である可能性が高いと判断します。

一般的に、P値が0.05以下であれば**「統計的に有意な差がある」**と表現します。

ただし、統計的有意差は、必ずしも実用的な意味を持つわけではありません。

学会や論文では、P値を具体的な数値で記載するか、記号(*, **, ***)で示しましょう。

今回の内容をマスターすれば、統計的な判断の第一歩を適切に踏み出せるようになります。次回は、P値が0.05以上だった場合、つまり「有意差がなかった」ときにどう考えればよいか、について解説します。

次回のテーマは「有意差がない結果になったらどうする?」です。お楽しみに!