重回帰分析における
標準化偏回帰係数を徹底解説

統計初心者の方にもわかりやすく、重回帰分析の重要な指標の一つである「標準化偏回帰係数」について解説します。 相関係数と同様に単位に依存せず、説明変数同士の影響度を比較できる便利な指標です。


標準化偏回帰係数とは?:概略と意義

重回帰分析では、複数の説明変数(原因となりそうな変数)を用いて、目的変数(結果となる変数)を予測したり、各説明変数が目的変数にどれくらい影響を与えているかを調べたりします。この際、それぞれの説明変数の影響度合いを示すのが「偏回帰係数」です。

そこで登場するのが「標準化偏回帰係数」です。これは、各説明変数と目的変数を、平均が0、標準偏差が1になるように「標準化」したデータを使って計算されます。 これにより、単位の影響を取り除き、異なる単位を持つ説明変数同士でも、目的変数への影響度合いを直接比較できるようになります。

例えるなら、それぞれの説明変数を同じ土俵に上げて、どの変数が一番力持ちかを比べることができる指標、といったイメージです。 標準化偏回帰係数の絶対値が大きいほど、その説明変数が目的変数に与える影響力が強いと解釈できます。


数値的な解釈の基準

標準化偏回帰係数の値は、通常、-1から1の間をとります(まれにこの範囲を超えることもありますが、その場合は-1または1とみなすことが多いです)。

相関係数と同様に、「どれくらいの値だったら強い影響と言える」という厳密な基準はありませんが、一般的には以下のように解釈されることが多いです。

ただし、これはあくまで目安であり、研究分野や分析対象によって解釈は異なります。重要なのは、他の説明変数の係数と比較して、相対的な影響の強さを評価することです。


ダミー変数の標準化偏回帰係数と解釈

ダミー変数とは、性別(男性、女性)や出身地(東京、大阪など)のような質的な情報を数値(例:男性を1、女性を0)に変換して分析に使う変数のことです。

ダミー変数を標準化すると、その「1標準偏差分の増加」が現実にはありえない変化(例えば、「男性度が0.5増える」といった連続的な変化)になってしまうため、ダミー変数の標準化偏回帰係数は、そのまま「1単位の増加」として解釈するのは難しいです。

もし、ダミー変数同士の影響を比較したい場合は、標準化されていない偏回帰係数を用いるか、分散分析における平方和(各要因が目的変数の変動にどれだけ寄与しているかを示す指標)に着目する方が適切です。


まとめ:標準化偏回帰係数の解釈にあたっての留意点

標準化偏回帰係数を解釈する際には、以下の点に留意しましょう。

標準化偏回帰係数の解釈における重要なポイント

これらの点に留意しながら、標準化偏回帰係数を活用して、データから有益な知見を引き出してください。

統計記事一覧に戻る