crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

景気ウォッチャー調査データと株価の分析2 - R言語で現状と先行きの相関関係を調べる。for関数で繰り返し処理の練習

 

www.crosshyou.info

 の続きです。

今回は、現状と先行きの相関関係の高い業種、低い業種はどこかを調べてみたいと思います。R言語で相関係数を調べるには、cor関数を使います。

まずは、合計現状と合計先行きの相関関係を調べましょう。

f:id:cross_hyou:20190209105727j:plain

相関係数は 0.9188761です。この相関が有意かどうかは、cor.test関数でわかります。

f:id:cross_hyou:20190209105928j:plain

p-value < 2.2e-16 と 0.05よりも小さいp値ですから有意です。

95%の信頼区間での相関係数は、0.8953760から0.9372724となっています。

ちなみに一番下に、0.9188761とcor関数で計算された相関係数が表示されています。

続いて、家計動向関連現状と家計動向関連先行きの相関係数を調べます。

f:id:cross_hyou:20190209111034j:plain

0.8826639です。合計よりは相関は低いですね。

次は、小売関連の現状と先行きですが、ここでちょっと立ち止まって考えましょう。

合計現状は3列目、合計先行きは25列目、差が22列

家計動向関連現状は4列目、家計動向関連先行きは25列目、差が22列

小売関連現状は5列目、小売関連先行きは27列目、差が22列と一定ですから、

cor(i列目, i+22列目)と一般化できそうです。そして一般化できたらfor関数で繰り返し処理ができそうですね。やってみましょう。

f:id:cross_hyou:20190209113924j:plain

やった!うまくできましたね!合計の相関係数、家計動向関連の相関係数が先にcor関数で計算した値と一致していますから成功ですね。まあ、それぞれの名前に「現状」がついているのは良しとしましょう。

こうして一連の相関係数を一つのベクトルにしましたから、sort関数で並び替えでどの業種が一番相関が低いか、高いか簡単にわかります。

f:id:cross_hyou:20190209114521j:plain

相関係数が一番小さいのは家電量販店です。一番高いのは雇用関連です。

家電量販店の相関係数は、0.3908757ですが、これは統計学的に有意でしょうか?cor.test関数で確認してみましょう。

f:id:cross_hyou:20190209114850j:plain

p-value = 2.081e-09 なので0.05よりも小さいです。有意ということですね。

散布図を描いてみましょう。

f:id:cross_hyou:20190209115148j:plain

f:id:cross_hyou:20190209115203j:plain

こんな感じです。現状が80を超えているのに、先行きが20以下という月があります。

一番相関係数の大きかった雇用関連の散布図も見てみましょう。

f:id:cross_hyou:20190209115510j:plain

f:id:cross_hyou:20190209115521j:plain

このような散布図です。右肩上がりの直線関係です。

家電量販店の推移のグラフも描いてみましょう。

f:id:cross_hyou:20190209121205j:plain

 

f:id:cross_hyou:20190209121218j:plain



はじめにrange関数でY軸の範囲を ylim という変数に格納して、plot関数で現状のグラフを描き、lines関数で先行きのグラフを追加しました。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。