F検定は不要! ウェルチのt検定で大丈夫!
統計初心者のための優しい解説
「2つのグループの平均に差があるか知りたい! よし、t検定だ!」
そう思ったときに、「ちょっと待って! その前に『等分散性のF検定』をしなきゃいけないんだよ!」と教えられて、
- F検定で「分散が等しいか」をまず確認
- もし等しければ、通常のt検定(スチューデントのt検定)
- もし等しくなければ、ウェルチのt検定
という手順を「当たり前」だと思っていませんか?
もしそうなら、その「当たり前」は、実はもう古い考え方かもしれません。
結論から言うと、多くの場合、わざわざF検定をする必要はありません。最初から「ウェルチのt検定」を使えば、ほとんどの状況で問題なく、むしろ安全なのです!
なぜそう言えるのか、分かりやすく説明しましょう。
そもそも、なぜF検定が必要だと言われていたの?
F検定は、「2つのグループのデータのばらつき(分散)が同じかどうか」を統計的にチェックするためのものです。
通常のt検定(スチューデントのt検定)は、「2つのグループの分散が等しい」という仮定(前提条件)のもとに成り立っています。もし分散が大きく異なると、通常のt検定の結果は信用できなくなってしまう可能性があります。
だから、「通常のt検定を使う前に、本当に分散が等しいか確認しようね」ということで、F検定が導入されたわけです。
なぜF検定は「もう不要」と言われるようになったの?
-
F検定そのものが不安定だから
F検定は、データが正規分布に従わない場合に、その結果が不安定になることがあります。つまり、「分散が等しいか」を調べたいのに、そのF検定の結果自体が信頼できないことがあるんです。これでは本末転倒ですよね。
-
F検定で「分散が等しい」と判断されても、実際は微妙に違うことがある
統計的に「有意差なし」と出たとしても、それは「差がない」ことを意味するわけではありません。「差があるとは言えない」という意味です。実際には微妙に分散が異なっているのに、「等しい」と判断されてしまい、誤って通常のt検定を使ってしまうリスクがあります。
-
一番の問題:「F検定でF検定をしてしまう」というジレンマ
F検定で「分散が等しい」と判断されたら通常のt検定、そうでなければウェルチのt検定、という手順を踏むと、実は「F検定の結果に応じて、その後の検定方法を変える」という、少し複雑なことをしていることになります。統計学の世界では、このような「事前検定(F検定)の結果に基づいて、本検定(t検定)を選ぶ」という手続きは、全体の検定の性質を歪めてしまう可能性がある、ということがわかってきました。
つまり、F検定という不確実な事前検定の結果に基づいて、その後の本命のt検定(平均値の差の検定)の手法を選んでしまうこと自体が、全体の解析の信頼性を低下させる可能性がある、というジレンマです。
救世主「ウェルチのt検定」の登場!
そこで注目されたのが、ウェルチのt検定です。
ウェルチのt検定は、通常のt検定とは異なり、「2つのグループの分散が等しいかどうか」を仮定しません。
つまり、
- もし分散が等しくても、ウェルチのt検定を使えます。
- もし分散が異なっていても、ウェルチのt検定を使えます。
どんな場合でも、ウェルチのt検定は適切に働くように設計されているのです!
例えるなら、
- 通常のt検定:晴れの日専用の日傘
- ウェルチのt検定:晴れの日も雨の日も使える、高機能な折りたたみ日傘兼雨傘
あなたは、天気予報が当たらないかもしれない状況で、いちいち天気予報を見て傘を選ぶ手間をかけたいですか? それとも、最初からどんな天気でも対応できる万能な傘を持っていきますか?
ほとんどの人は、後者を選ぶでしょう。統計解析も同じです。
なぜウェルチのt検定を使えば「安心」なのか?
-
頑健性が高い(ロバストである)
ウェルチのt検定は、分散が等しいかどうかにかかわらず、正しい結果を出しやすいという「頑健性(ロバストネス)」に優れています。つまり、少々の条件のずれがあっても、大きく結果が狂うことが少ない、信頼性の高い方法なのです。
-
検定力も十分にある
「じゃあ、等分散なのにウェルチを使うと、検出力が落ちるんじゃないの?」と思うかもしれません。しかし、近年の研究では、分散が本当に等しい場合でも、ウェルチのt検定の検出力は通常のt検定とほとんど変わらないことが示されています。つまり、わざわざ難しいF検定をしてまで通常のt検定を選ぶメリットが、ほとんどないということです。
-
手順がシンプルになる
F検定の手間が省けるので、解析の手順がシンプルになり、間違いも起こりにくくなります。
まとめ:あなたの「思い込み」を解くキーワード!
- F検定は、もう必須ではない!
- ウェルチのt検定は、「等分散でなくても良い」つまり「等分散でも、等分散でなくても、どちらの場合でも適切に使える」万能な検定方法!
- 迷ったら、最初からウェルチのt検定を使おう!それが安全で、頑丈で、手っ取り早い!
もちろん、等分散性のF検定を学ぶこと自体が無意味なわけではありません。統計学の理論を深く理解するためには、それぞれの検定の仮定を学ぶことは重要です。しかし、実際にデータ解析を行う上では、より実用的で信頼性の高いウェルチのt検定を積極的に採用することをお勧めします。
この解説で、あなたの「F検定しなければ!」という思い込みが少しでも軽くなれば幸いです。自信を持って、ウェルチのt検定を使いこなしてくださいね!