の続きです。
今回は各変数の相関関係をR言語でみてみましょう。
まず、plot関数で散布図マトリックスをみてみましょう。
変数がいっぱいありすぎて、どれがどれだかわからないですね。。。
前年同月比のほうも作成してみます。
こちらは売上品目の構成比率が無いぶんだけわかりやすいですね。
cor関数で相関マトリックスをだしてみます。
一番左側の列、全店売上高との相関に着目すると、一番相関の高いのは、既存店売上高です。相関係数は0.98972236です。逆に非食品はマイナス相関で-0.35668010です。
前年同月比のデータも相関マトリックスを作成しましょう。
これも一番左の列、全店売上高との相関に着目すると、既存店売上高が一番相関が強く0.8552834です。全店舗数は-0.4147895とマイナス相関になっています。店舗数の前年同月比と全店売上高がマイナス相関というのは直感に反する感じがします。cor.test関数で有意な相関関係なのか確認しましょう。
p-value = 0.18 とあります。0.05よりも大きいのでこの相関関係は有意ではないです。
95 percent confidence intervalも -0.7985884 から 0.2088218 とあります。この信頼区間の中に 0 がありますから相関関係は無いということです。
同じように、全店売上高と非食品の相関関係を検定しましょう。
p-value = 0.08693 です。0.05 よりも大きいので、こちらの組み合わせも有意な相関とは言えません。95%信頼区間の相関係数を見ると、-0.66458560 から 0.05436242 と 0 が含まれています。
今回は以上です。
次回は
です。