ログランク検定は「生存時間の差の検定」??
統計初心者が陥る誤解を解き明かす

生存時間分析と聞くと、「Aという治療法とBという治療法で、患者さんの生存期間に平均的にどのくらいの差があるのかを調べるんでしょ?」と思う方もいらっしゃるかもしれません。特に統計初心者の方の中には、普段使い慣れているt検定のように、生存時間の平均値などを比較する検定だと想像している方もいるのではないでしょうか。

しかし、ログランク検定は、決して「生存時間の平均値の差」を比較する検定ではありません。では、一体何を見ているのでしょうか? 計算式なしで、具体例でイメージを掴んでいきましょう。


具体例でイメージするログランク検定

ここに2つの薬があるとします。新しい薬Aと、これまでの標準的な薬Bです。私たちは、この2つの薬が、がん患者さんの「再発までの期間」に違いをもたらすのかを知りたいと考えています。

もし、ログランク検定が平均的な期間の差を見ているのなら、薬Aを飲んだグループの平均再発期間と、薬Bを飲んだグループの平均再発期間を比較すれば良いことになります。しかし、生存時間データには「途中で観察が終わってしまったデータ」という厄介な問題があります。

たとえば、ある患者さんが途中で研究から脱落してしまったり、研究期間中に再発しなかったりした場合、その患者さんの正確な再発までの期間はわかりません。研究期間が終了した時点でまだ再発していなくても、もっと長く観察を続ければ再発が確認される可能性はありますよね。このような「イベントが発生する前に観察が終わってしまったデータ」は、通常の平均値計算では扱えません。


ログランク検定が見ているのは「イベントの起こりやすさ」

ログランク検定が注目するのは、「ある時点において、まだ再発していない人が、どれくらいの割合で再発しているか」、つまり「イベント(この場合は再発)の起こりやすさ」です。

想像してみてください。あなたは、薬Aと薬Bを服用している患者さんのグループを毎日観察しています。

「もし、薬Aを飲んでいるグループと薬Bを飲んでいるグループで、再発のしやすさが全く同じだったとしたら…」

これは、それぞれの日に、まだ再発していない患者さんの中から、同じくらいの割合で再発する人が現れるはず、という考え方です。

ログランク検定は、この「もし、同じだったとしたら」という仮説が、実際のデータとどれくらいズレているかを評価します。もし、薬Aを飲んだグループの方が、薬Bを飲んだグループよりも、ある日を境にグッと再発する人が増えたとしたら、それは「再発のしやすさに違いがある」と判断する材料になります。


なぜ平均値ではないのか? 「タイミング」が重要だから

t検定が平均値を比較するのに対し、ログランク検定が「イベントの起こりやすさ」を見るのは、生存時間分析において「イベントが起こるタイミング」が非常に重要だからです。

たとえば、どちらの薬も平均再発期間が同じだったとしても、薬Aは治療開始直後に再発する人が多いけれど、薬Bはもっと時間が経ってから再発する人が多い、というケースが考えられます。この場合、単純な平均値だけでは見えてこない重要な違いがありますよね。ログランク検定は、この時間の経過に伴うイベントの発生パターン全体の差を評価しようとします。


ログランク検定のざっくりとしたイメージ

ログランク検定は、まるで「鬼ごっこ」のようなものです。

もし、薬Aのグループの方が、薬Bのグループよりも、時間の経過とともにどんどん鬼に捕まる(再発する)人が増えていくようであれば、「この2つのグループは、再発のしやすさが違うだろう」と判断するわけです。


まとめ

ログランク検定は、生存時間データの「イベント発生パターン」に統計的に有意な差があるかどうかを評価するものです。平均値の差を見るt検定とは異なり、途中で観察が終わってしまったデータに対応し、時間の経過とともにイベントがどのように発生していくか、その「ペース」や「割合」の違いに着目しています。

もしあなたが生存時間分析に関わることになったら、「ログランク検定は平均の差じゃない!」ということを思い出してみてください。それは、あなたがより深くデータを理解する手助けになるはずです。

統計記事一覧に戻る