www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

国民経済計算四半期GDP速報データの分析5 - R言語で株価、株価の騰落率とGDPデータの相関を調べる。

 

www.crosshyou.info

 の続きです。

今回は、株価、株価の騰落率とGDPデータの相関係数を調べてみようと思います。

相関係数はcor関数でわかります。

f:id:cross_hyou:20190420155849j:plain

soukan <- の行で、株価とGDPの各データの相関係数を計算しています。round関数で小数点以下3桁までにしています。

names(soukan) <- の行で算出した各データに名前を付けています。

rev(sort の行で相関係数の大きい順に表示しています。Kabukaと一番相関の高いのは、MinSetsu, つまり民間企業設備で、0.526ですね。いちおう確認しましょう。

f:id:cross_hyou:20190420160328j:plain

cor.test関数を使いました。一番下の行の0.5263771とあります。これが相関係数です。さきの計算結果と同じですね。p-value = 1.857e-08なので有意です。

1年後の株価騰落率、Kabuka.1Yとの相関も同じようにやってみましょう。

f:id:cross_hyou:20190420161615j:plain

Kabuka.1YにはNAの行があります。NAがあると相関係数がうまく計算できないので、na.omit関数でNAのないデータフレーム、data2をはじめにつくり、あとは株価との相関係数を算出するのと同じ手順で相関係数を算出しています。絶対値ベースでNetExpo(純輸出)が、-0.306と一番相関がありますね。確認します。

f:id:cross_hyou:20190420162049j:plain

cor.testの結果です。一番下の行の相関係数が -0.305555で一致しています。p-value = 0.003058ですから有意な相関ということです。マイナス相関ですから、純輸出がプラスのときは1年後は株価は安くなっている、純輸出がマイナスのときは1年後は株価は高くなっている、ということですね。

グラフで確認します。散布図を書いてみます。

f:id:cross_hyou:20190420162622j:plain

 

f:id:cross_hyou:20190420162634j:plain

lm関数で線形単回帰モデルを作り、そのモデルをabline関数で散布図の上に重ねてみました。右肩下がりですが、NetExpoだけで1年後の株価の騰落率を説明するのは難しいようですね。

今回は以上です。

次回は

 

www.crosshyou.info

 

です。

今回のR言語のコードです。

# KabukaとGDP各データの相関係数
soukan <- round(cor(data$Kabuka, data[ , 1:12]), 3)
names(soukan) <- colnames(data)[1:12]
rev(sort(soukan))

# KabukaとMinsetsuの相関係数
cor.test(data$Kabuka, data$MinSetsu)

# Kabuka.1YとGDP各データの相関係数
data2 <- na.omit(data)
soukan2 <- round(cor(data2$Kabuka.1Y, data2[ , 1:12]), 3)
names(soukan2) <- colnames(data2)[1:12]
rev(sort(soukan2))

# Kabuka.1YとNetExpoの相関関係
cor.test(data2$Kabuka.1Y, data2$NetExpo)

# Kabuka.1YとNetExpoの散布図
plot(data2$NetExpo, data2$Kabuka.1Y)
abline(lm(Kabuka.1Y ~ NetExpo, data = data2), col = 2)