「ゼロからわかる!実用統計学講座」
難しい理論より実践的な知識を最短で学びたい方のための統計学
第1回 「この差は本当に意味があるの?」
統計学は、データから何かを判断するための道具です。
たとえば、新しいダイエット方法を試した2つのグループがあるとします。グループAは平均3kg痩せ、グループBは平均2.5kg痩せました。この0.5kgの差は、本当にダイエット方法の効果によるものなのでしょうか?それとも、単なる偶然でしょうか?
この「偶然ではなさそうだ」と判断するための考え方が、今回お話しする統計的検定です。
P値とは何か?
統計的検定の中心となるのがP値(ピーち)です。P値とは、簡単に言うと「偶然によって、今見ている結果(あるいはそれ以上に極端な結果)が得られる確率」を表します。
もし、先ほどのダイエットの例で、P値が0.05だったとします。これは「この2つのグループに効果の差が全くないにもかかわらず、偶然によって0.5kg以上の差が生まれる確率は5%である」ことを意味します。
このP値が小さいほど、その差は偶然ではない、つまり「意味のある差」である可能性が高いと考えられます。
一般的に、P値が0.05(5%)以下であれば、「統計的に有意な差がある」と判断することが多いです。これは、5%以下であれば、偶然の可能性は低いと見なす、という社会的な慣習のようなものです。この0.05という基準は、有意水準と呼ばれます。
重要な注意点
P値が0.05以下であっても、その差が「医学的に意味がある」「ビジネス的に重要である」とは限りません。P値はあくまで統計的な判断基準であり、実用的な意味は別途考慮する必要があります。
検定とP値の実際の計算方法
P値の計算には、Excelや統計ソフトを使います。基本的なステップは以下の通りです。
- 帰無仮説を立てる
「2つのグループの間に差はない」という、否定したい仮説を立てます。これを帰無仮説と呼びます。 - 適切な統計手法を選ぶ
比較するデータの種類(数値データ、カテゴリデータなど)やグループの数によって、適切な検定手法を選びます。代表的なものに、2つのグループの平均値を比較するt検定などがあります。 - 統計ソフトでP値を計算する
Excelなどのソフトウェアにデータを入力し、選んだ検定手法を使ってP値を計算します。
学会発表や論文での表現方法
研究論文では、P値を使って結果を客観的に報告します。以下の2つの表現を覚えておきましょう。
- P値そのものを記載する
「〇〇と〇〇の間には統計的に有意な差が認められた(t = 2.5, P = 0.012)」のように、P値の具体的な数値を記載します。これにより、読者は判断の根拠を正確に把握できます。 - 記号で表現する
表やグラフの中で、「*(アスタリスク)」などの記号を使って有意差を示すこともあります。- p < 0.05:*
- p < 0.01:**
- p < 0.001:***
NGな表現の例
「P値が0.05より小さかったので、帰無仮説は真である」のような表現は誤りです。あくまで「帰無仮説を棄却する」のであって、証明するわけではありません。
本日のまとめ
P値は、「偶然によってその結果(またはそれ以上に極端な結果)が得られる確率」です。
P値が小さいほど、偶然ではない(=意味のある)差である可能性が高いと判断します。
一般的に、P値が0.05以下であれば**「統計的に有意な差がある」**と表現します。
ただし、統計的有意差は、必ずしも実用的な意味を持つわけではありません。
学会や論文では、P値を具体的な数値で記載するか、記号(*, **, ***)で示しましょう。
今回の内容をマスターすれば、統計的な判断の第一歩を適切に踏み出せるようになります。次回は、P値が0.05以上だった場合、つまり「有意差がなかった」ときにどう考えればよいか、について解説します。
次回のテーマは「有意差がない結果になったらどうする?」です。お楽しみに!