今回は、金の各需要の相関関係を見たいと思います。
まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。
相関係数を出す関数はcor関数です。早速やってみましょう。
gold_matrix <- gold[ , c(-1,-2)] で計算に必要のない年と月の列を削除しています。
gold_matrix <- as.matrix(gold_matrix) でgold_matrixのデータ型をデータ・フレームから行列(マトリックス)に変換しています。cor関数がデータ・フレームでは動かないからです。
そして、cor関数で相関を計算しています。ちょっと桁数が多くて見づらいので、round関数で値をまるめましょう。
わかりやすくなりました。
相関係数の大きいのは、歯科医療とメッキの組み合わせが0.6、電機機械と宝飾の組み合わせが0.43ですね。
この二つの組み合わせの相関が有意かどうかをcor.test関数で確認しましょう。
p-value = 0.01165 < 0.05 ですから、歯科医療とメッキには相関関係はありますね。正の相関です。
p-value = 0.08888 > 0.05 ですから、電機機械と宝飾に相関関係があるとはいえません。
plot関数で2つ組み合わせの散布図を見てみましょう。
par(mfrow=c(1,2)) で始めにグラフウィンドウを 1 x 2 に設定します。
そのあとにplot関数で散布図を書きます。
このようにみると確かに歯科医療とメッキの組み合わせのほうが相関していることがわかりますね。
ちなみにplot関数をデータ・フレームに適用するとこうなります。
散布図のマトリックスになります。