の続きです。
今回は、株価、株価の騰落率とGDPデータの相関係数を調べてみようと思います。
相関係数はcor関数でわかります。
soukan <- の行で、株価とGDPの各データの相関係数を計算しています。round関数で小数点以下3桁までにしています。
names(soukan) <- の行で算出した各データに名前を付けています。
rev(sort の行で相関係数の大きい順に表示しています。Kabukaと一番相関の高いのは、MinSetsu, つまり民間企業設備で、0.526ですね。いちおう確認しましょう。
cor.test関数を使いました。一番下の行の0.5263771とあります。これが相関係数です。さきの計算結果と同じですね。p-value = 1.857e-08なので有意です。
1年後の株価騰落率、Kabuka.1Yとの相関も同じようにやってみましょう。
Kabuka.1YにはNAの行があります。NAがあると相関係数がうまく計算できないので、na.omit関数でNAのないデータフレーム、data2をはじめにつくり、あとは株価との相関係数を算出するのと同じ手順で相関係数を算出しています。絶対値ベースでNetExpo(純輸出)が、-0.306と一番相関がありますね。確認します。
cor.testの結果です。一番下の行の相関係数が -0.305555で一致しています。p-value = 0.003058ですから有意な相関ということです。マイナス相関ですから、純輸出がプラスのときは1年後は株価は安くなっている、純輸出がマイナスのときは1年後は株価は高くなっている、ということですね。
グラフで確認します。散布図を書いてみます。
lm関数で線形単回帰モデルを作り、そのモデルをabline関数で散布図の上に重ねてみました。右肩下がりですが、NetExpoだけで1年後の株価の騰落率を説明するのは難しいようですね。
今回は以上です。
次回は
です。
今回のR言語のコードです。
# KabukaとGDP各データの相関係数
soukan <- round(cor(data$Kabuka, data[ , 1:12]), 3)
names(soukan) <- colnames(data)[1:12]
rev(sort(soukan))
# KabukaとMinsetsuの相関係数
cor.test(data$Kabuka, data$MinSetsu)
# Kabuka.1YとGDP各データの相関係数
data2 <- na.omit(data)
soukan2 <- round(cor(data2$Kabuka.1Y, data2[ , 1:12]), 3)
names(soukan2) <- colnames(data2)[1:12]
rev(sort(soukan2))
# Kabuka.1YとNetExpoの相関関係
cor.test(data2$Kabuka.1Y, data2$NetExpo)
# Kabuka.1YとNetExpoの散布図
plot(data2$NetExpo, data2$Kabuka.1Y)
abline(lm(Kabuka.1Y ~ NetExpo, data = data2), col = 2)