Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

貴金属流通統計調査の分析5 - 金の各需要の相関関係を見る。(plot関数、cor関数、cor.test関数)

今回は、金の各需要の相関関係を見たいと思います。

まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。

f:id:cross_hyou:20180920112154j:plain

相関係数を出す関数はcor関数です。早速やってみましょう。

f:id:cross_hyou:20180920112637j:plain

gold_matrix <- gold[ , c(-1,-2)] で計算に必要のない年と月の列を削除しています。

gold_matrix <- as.matrix(gold_matrix) でgold_matrixのデータ型をデータ・フレームから行列(マトリックス)に変換しています。cor関数がデータ・フレームでは動かないからです。

そして、cor関数で相関を計算しています。ちょっと桁数が多くて見づらいので、round関数で値をまるめましょう。

f:id:cross_hyou:20180920113220j:plain

わかりやすくなりました。

相関係数の大きいのは、歯科医療とメッキの組み合わせが0.6、電機機械と宝飾の組み合わせが0.43ですね。

この二つの組み合わせの相関が有意かどうかをcor.test関数で確認しましょう。

f:id:cross_hyou:20180920113628j:plain

p-value = 0.01165 < 0.05 ですから、歯科医療とメッキには相関関係はありますね。正の相関です。

f:id:cross_hyou:20180920113840j:plain

p-value = 0.08888 > 0.05 ですから、電機機械と宝飾に相関関係があるとはいえません。

plot関数で2つ組み合わせの散布図を見てみましょう。

f:id:cross_hyou:20180920114314j:plain

par(mfrow=c(1,2)) で始めにグラフウィンドウを 1 x 2 に設定します。

そのあとにplot関数で散布図を書きます。

f:id:cross_hyou:20180920114452j:plain

このようにみると確かに歯科医療とメッキの組み合わせのほうが相関していることがわかりますね。

ちなみにplot関数をデータ・フレームに適用するとこうなります。

f:id:cross_hyou:20180920114926j:plain

f:id:cross_hyou:20180920114934j:plain

散布図のマトリックスになります。