この記事では、エクセルで相関関係を表すグラフの作り方について解説しています。
相関係数について・相関係数を求めることのできる関数・相関係数を確認することのできる散布図というグラフについてご紹介しています。
エクセルのグラフについては、下記にまとめた記事もありますのでこちらもご参考下さい。
相関係数とは?
相関係数とは、2種類のデータの関連性を表す指標の1つです。
2種類のデータに正の相関がある場合、1つのデータが増加すればもう1方のデータも増加するということになります。(散布図では右肩上がりのグラフになる)
2種類のデータに負の相関がある場合、1つのデータが増加すればもう1方のデータは減少するということになります。(散布図では右肩下がりのグラフになる)
2種類のデータに正の相関がある場合のグラフ例
2種類のデータに負の相関がある場合のグラフ例
相関が無い場合は、散らばったようなグラフになります。
繰り返しとなりますが、このような2種類のデータの関連性を表す指標が相関係数で、下記のようになります。
相関係数
- 相関係数が1に近い・・・正の相関がある
- 相関係数が-1に近い・・・負の相関がある
- 相関係数が0に近い・・・相関がない
相関係数は長い数式を使って求めることが可能ですが、エクセルでは関数が準備されているのでそちらを使用すれば相関係数を求めることができます。
相関係数に関する関数
エクセルで相関係数を求めるには、CORREL関数を使用します。
CORREL関数は、引数に2種類のデータ範囲を指定することで相関係数を求めることができます。
CORREL関数の使い方
=CORREL(配列1,配列2)
例えば下記のように、「平均気温」と「来場者」という2種類のデータがあるとします。
この2種類のデータに対して、CORREL関数を使って相関係数を求めるには、このような数式となります。
1つ目の引数に1種類目のデータ範囲、もう1つの引数に2種類目のデータ範囲を指定する形ですね。
このデータだと結果は0.536987という正の相関がある結果となります。
見た感じから明らかに相関のある、下記のデータで相関係数を求めてみます。
桁数は異なりますが、一方のデータの値が大きくなると同じ感じでもう1方のデータの値も大きくなっていますよね。
こちらについてもCORREL関数を使って相関係数を求めると、結果は1となります。強い正の相関があるということです。
実際に相関係数を求める場合は、かなり多くのデータ量を基に計算しなければ判断できないため、あくまで算出方法の参考とお考え下さい。
散布図
散布図とは、2種類のデータに相関があるかどうか、散らばり具合で確認することのできる図のことです。
最初のところで解説した、下記のような図が散布図です。
散布図の作り方としては、まず2種類のデータを準備します。例えば今回は、平均気温と来場者のデータです。
「挿入」タブの「グラフ」リボンより散布図を選択すると散布図が作成されます。
散布図ついては下記の記事で詳しく解説していますので、こちらもご参照下さい。