Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

JFAコンビニエンスストア統計調査月報データの分析4 - R言語で相関関係を分析

 

www.crosshyou.info

 の続きです。

今回は各変数の相関関係をR言語でみてみましょう。

まず、plot関数で散布図マトリックスをみてみましょう。

f:id:cross_hyou:20190125120948j:plain

f:id:cross_hyou:20190125120959j:plain

変数がいっぱいありすぎて、どれがどれだかわからないですね。。。

前年同月比のほうも作成してみます。

f:id:cross_hyou:20190125121233j:plain

f:id:cross_hyou:20190125121244j:plain

こちらは売上品目の構成比率が無いぶんだけわかりやすいですね。

cor関数で相関マトリックスをだしてみます。

f:id:cross_hyou:20190125121503j:plain

一番左側の列、全店売上高との相関に着目すると、一番相関の高いのは、既存店売上高です。相関係数は0.98972236です。逆に非食品はマイナス相関で-0.35668010です。

前年同月比のデータも相関マトリックスを作成しましょう。

f:id:cross_hyou:20190125121927j:plain

これも一番左の列、全店売上高との相関に着目すると、既存店売上高が一番相関が強く0.8552834です。全店舗数は-0.4147895とマイナス相関になっています。店舗数の前年同月比と全店売上高がマイナス相関というのは直感に反する感じがします。cor.test関数で有意な相関関係なのか確認しましょう。

f:id:cross_hyou:20190125122438j:plain

p-value = 0.18 とあります。0.05よりも大きいのでこの相関関係は有意ではないです。

95 percent confidence intervalも -0.7985884 から 0.2088218 とあります。この信頼区間の中に 0 がありますから相関関係は無いということです。

同じように、全店売上高と非食品の相関関係を検定しましょう。

f:id:cross_hyou:20190125123139j:plain

p-value = 0.08693 です。0.05 よりも大きいので、こちらの組み合わせも有意な相関とは言えません。95%信頼区間の相関係数を見ると、-0.66458560 から 0.05436242 と 0 が含まれています。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。