の続きです。
今回は、現状と先行きの相関関係の高い業種、低い業種はどこかを調べてみたいと思います。R言語で相関係数を調べるには、cor関数を使います。
まずは、合計現状と合計先行きの相関関係を調べましょう。
相関係数は 0.9188761です。この相関が有意かどうかは、cor.test関数でわかります。
p-value < 2.2e-16 と 0.05よりも小さいp値ですから有意です。
95%の信頼区間での相関係数は、0.8953760から0.9372724となっています。
ちなみに一番下に、0.9188761とcor関数で計算された相関係数が表示されています。
続いて、家計動向関連現状と家計動向関連先行きの相関係数を調べます。
0.8826639です。合計よりは相関は低いですね。
次は、小売関連の現状と先行きですが、ここでちょっと立ち止まって考えましょう。
合計現状は3列目、合計先行きは25列目、差が22列
家計動向関連現状は4列目、家計動向関連先行きは25列目、差が22列
小売関連現状は5列目、小売関連先行きは27列目、差が22列と一定ですから、
cor(i列目, i+22列目)と一般化できそうです。そして一般化できたらfor関数で繰り返し処理ができそうですね。やってみましょう。
やった!うまくできましたね!合計の相関係数、家計動向関連の相関係数が先にcor関数で計算した値と一致していますから成功ですね。まあ、それぞれの名前に「現状」がついているのは良しとしましょう。
こうして一連の相関係数を一つのベクトルにしましたから、sort関数で並び替えでどの業種が一番相関が低いか、高いか簡単にわかります。
相関係数が一番小さいのは家電量販店です。一番高いのは雇用関連です。
家電量販店の相関係数は、0.3908757ですが、これは統計学的に有意でしょうか?cor.test関数で確認してみましょう。
p-value = 2.081e-09 なので0.05よりも小さいです。有意ということですね。
散布図を描いてみましょう。
こんな感じです。現状が80を超えているのに、先行きが20以下という月があります。
一番相関係数の大きかった雇用関連の散布図も見てみましょう。
このような散布図です。右肩上がりの直線関係です。
家電量販店の推移のグラフも描いてみましょう。
はじめにrange関数でY軸の範囲を ylim という変数に格納して、plot関数で現状のグラフを描き、lines関数で先行きのグラフを追加しました。
今回は以上です。
次回は
です。