スピアマンの順位相関係数の導出(同順位なしの場合)

ノンパラメトリック検定

順位相関係数とは

2次元データにおいて、それらが順位データまたは順序尺度のときの相関係数を順位相関係数(rank coefficient of correlation)と言います。順位相関係数には次のようなものがあります。※同順位(タイ)を含む順位データについては補正が必要となりますが、本記事では同順位を含まない順位データについてのみ取り扱います。

スピアマンの順位相関係数
  • スピアマンの順位相関係数(Spearman rank correlation coefficient)
    順位データに対してピアソンの積率相関係数と同様の方法で算出する。
    $$
    \begin{align}
    r_s := 1- \frac{6\sum^n_{i=1}(x_i – y_i)^2}{n(n^2-1)}\\
    \end{align}
    $$

今回はこの中でもスピアマンの順位相関係数の導出を行いたいと思います。

スピアマンの順位相関係数の導出

その前にピアソンの積率相関係数を復習します。

【復習】ピアソンの積率相関係数

$(x_i, y_i)$の2次元データを考えた時、ピアソンの積率相関係数は次のように計算できる。

$$
r_p = \frac{\sum^{n}_{i=1}(x_i-\bar{x})(y_i-\bar{y})}
{\sqrt{\sum^{n}_{i=1}(x_i-\bar{x})^2{\sum^{n}_{i=1}(y_i-\bar{y})^2}}}
=\left(
\frac{s_{xy}}{\sqrt{s_x^2s_y^2}}
\right)
$$

スピアマンの順位相関係数はこのピアソンの積率相関係数と同様の計算方法で算出することができます。それでは順位データに同順位がない場合のスピアマンの相関係数を導出しましょう。

以降の$\{x_i\},\{y_i\},(i=1,\cdots,n)$は順位データとします。その上で、ピアソンの積率相関係数の分子を変形しましょう。

$$
\begin{align}
\sum^{n}_{i=1}(x_i-\bar{x})(y_i-\bar{y})
&= \sum^{n}_{i=1}x_iy_i – n\bar{x}\bar{y}\\
&= \sum^{n}_{i=1}\left\{
\frac{1}{2}(x_i^2 – 2x_iy_i + y_i^2)\: + \frac{1}{2}(x_i^2 + y_i^2)
\right\}- n\bar{x}\bar{y}\\
&= -\frac{1}{2}\sum^{n}_{i=1}(x_i – y_i)^2 + \frac{1}{2}(n\overline{x^2} + n\overline{y^2})\: – n\bar{x}\bar{y}
\end{align} \\
$$

ここで、$\{x_i\},\{y_i\}$が順位データであることから

$$
\begin{align}
\overline{x^2}=\overline{y^2}=\frac{(n+1)(2n+1)}{6}, \quad\bar{x} = \bar{y} = \frac{(n+1)}{2}
\end{align} \\
$$

よって、

$$
\begin{align}
\sum^{n}_{i=1}(x_i-\bar{x})(y_i-\bar{y})
&=-\frac{1}{2}\sum^{n}_{i=1}(x_i – y_i)^2 + \frac{n(n+1)(2n+1)}{6}\:
– n\left(\frac{n+1}{2}\right)^2
\end{align} \\
$$

次にピアソンの積率相関係数の分母を変形します。

$$
\begin{align}
\sum^n_{i=1}(x_i-\bar{x})^2
&= \sum^n_{i=1}x_i^2-n\bar{x}^2\\
&=\frac{n(n+1)(2n+1)}{6}-n\left(\frac{n+1}{2}\right)^2\\
&= n\left(\frac{n+1}{2}\right)
\left(
\frac{2n+1}{3} – \frac{n+1}{2}
\right)\\
&=n\left(\frac{n+1}{2}\right)
\left(
\frac{n-1}{6}
\right)\\
&=n\left(\frac{n^2-1}{12}\right)\\
&=\frac{n(n^2-1)}{12}
\end{align}
$$

そして、$\{x_i\},\{y_i\}$が順位データであることから$\sum^n_{i=1}(x_i-\bar{x})^2 = \sum^n_{i=1}(y_i-\bar{y})^2 $なので、

$$
\begin{align}
\sqrt{\sum^{n}_{i=1}(x_i-\bar{x})^2{\sum^{n}_{i=1}(y_i-\bar{y})^2}}
&= \frac{n(n^2-1)}{12}
\end{align}
$$

以上より、スピアマンの順位相関係数は

$$
\begin{align}
r_s
&= \frac{-\frac{1}{2}\sum^{n}_{i=1}(x_i – y_i)^2 + \frac{n(n+1)(2n+1)}{6}\:
– n\left(\frac{n+1}{2}\right)^2}{\frac{n(n^2-1)}{12}}\\
&= \frac{-6\sum^{n}_{i=1}(x_i – y_i)^2 + 2n(n+1)(2n+1)\:
– 3n{(n+1)^2}}{n(n^2-1)}\\
&= -\frac{6\sum^{n}_{i=1}(x_i – y_i)^2
+ n(n+1)(4n+2 – 3n-3)}{n(n^2-1)}\\
&= -\frac{6\sum^{n}_{i=1}(x_i – y_i)^2 + n(n+1)(n-1)}{n(n^2-1)}\\
&= -\frac{6\sum^{n}_{i=1}(x_i – y_i)^2 + n(n^2-1)}{n(n^2-1)}\\
&= -\frac{6\sum^{n}_{i=1}(x_i – y_i)^2}{n(n^2-1)}
+ 1\\
&= 1 -\frac{6\sum^{n}_{i=1}(x_i – y_i)^2}{n(n^2-1)}
\end{align}
$$

となり、スピアマンの順位相関係数が得られました。

まとめ

今回は、スピアマンの順位相関係数の同順位(タイ)がない場合の導出を行いました。実際の使い方の部分は別の記事でまとめたいと思います。順位相関係数には他にもケンドールの順位相関係数というものも存在しますので、そちらについてもまとめていければと思っています。

コメント

タイトルとURLをコピーしました