反復測定データの解析における鍵:
各被験者内の測定値間に想定する相関構造とは?

反復測定データは、同じ対象(被験者など)から複数回にわたって測定されたデータであり、医学、心理学、社会科学など多岐にわたる分野で頻繁に登場します。このようなデータを解析する際、通常の独立したデータ解析手法をそのまま適用すると、誤った結論を導き出す可能性があります。その理由は、同じ被験者から得られた測定値は、互いに独立ではなく、何らかの相関を持つと考えるのが自然だからです。

この「何らかの相関」を統計モデルに適切に組み込むことが、反復測定データ解析の成否を分ける重要なポイントとなります。本記事では、この「相関構造」に焦点を当て、その種類、必要性、そして統計ソフトウェアでの扱いについて詳しく解説します。


1. 反復測定データを解析する際に考慮する相関構造とは

反復測定データでは、時間の経過とともに測定が行われる場合や、異なる条件下で同じ被験者の反応を測定する場合などがあります。このようなデータでは、同じ被験者の最初の測定値と2番目の測定値、2番目の測定値と3番目の測定値といった具合に、各測定値間に「関連性」が生じます。この関連性のパターンを数理的に表現したものが「相関構造」です。

相関構造を適切にモデル化しないと、標準誤差が過小評価されたり、統計的有意性があるにもかかわらず見落とされたり(あるいはその逆)、推定された効果が不正確になったりする可能性があります。


2. よく想定される相関構造とそれぞれの特徴

反復測定データでよく用いられる相関構造には、いくつかの典型的なパターンがあります。それぞれの特徴を理解することは、適切なモデル選択に不可欠です。

2.1. 複合対称性 (Compound Symmetry: CS)

2.2. 自己回帰一次 (Autoregressive Order 1: AR(1))

2.3. 非構造化 (Unstructured: UN)

上記以外にも、等分散のAR(1)を拡張したAR(p)ToeplitzBand ToeplitzHeterogeneous Compound Symmetryなど、様々な相関構造が存在します。


3. 相関構造を指定する必要性

相関構造を適切に指定することは、以下のような理由から非常に重要です。


4. 相関構造を指定できる統計ソフトウェアとその関数

相関構造を指定できる代表的な統計ソフトウェアとしては、主に混合効果モデルや一般化推定方程式 (GEE) を扱うパッケージが挙げられます。

R

Rでは、主にnlmeパッケージとlme4パッケージが混合効果モデルの解析に用いられますが、相関構造の指定に関して両者には重要な違いがあります。

SAS

SASでは、PROC MIXEDプロシージャが混合効果モデルの解析に広く用いられ、多様な相関構造を指定できます。

Stata

Stataでは、xtmixed(混合効果モデル)やxtgee(一般化推定方程式)コマンドで相関構造を指定できます。


5. まとめ

統計記事一覧に戻る