〈解説〉相関係数
相関係数
対応のある2つの量的変数\(X\)と\(Y\)があるとき、2つの変数の間に直線的な関連があるかどうかを検討するための指標が相関係数です。各データの偏差をXY平面上にプロットしたとき、プロットがおおむね右上がりであれば、\(X\)の値が大きい時に\(Y\)の値も大きい傾向にあるといえます。これを「正の相関がある」といい、相関係数は正の値をとります。逆に、右下がりであれば、\(X\)の値が大きい(小さい)時に、\(Y\)の値は小さい(大きい)傾向にあることといえます。これを「負の相関がある」といい、相関係数は負の値をとります。どちらともいえない(はっきりした傾向がみられない)とき、「相関がない」、「無相関である」といい、相関係数は0に近い値をとります。
相関係数の解釈
相関係数は、2つの量的変数に「直線的な関連」があるかどうかを見るための指標です。したがって、2つの変数が2次関数的な関連をもつとき(たとえばプロットが放物線を描くようなとき)は、相関係数は適切な指標ではありません。
また、相関係数は標本サイズが大きい時、有意になりやすい指標です。外れ値の影響も強く受けます。相関係数が有意であることや、相関係数の絶対値が大きいことは、「2つの変数の直線的な関連の強さ」を直接的に示すものではありません。データのプロットをよく観察することが重要です。