Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の工業用水量のデータの分析4 - R言語のいろいろなパッケージで相関係数マトリックスを作成する。

f:id:cross_hyou:20211107082742j:plain

Photo by Daniel Seifried on Unsplash 

www.crosshyou.info

の続きです。

今回は、各変数間の相関関係をみてみましょう。

2014年のデータを使ってみてみます。

まずは、調べる変数名の確認です。対数変換した変数で調べます。

f:id:cross_hyou:20211107083348p:plain

names()関数でデータフレームdfの変数を表示しました。sort()関数でアルファベット順にしています。対数変換した変数は、"l_"で始まる変数です。

l_gdp: 対数変換した県内総生産額(百万円)

l_kachi: 対数変換した製造業付加価値額(百万円)

l_num: 対数変換した製造業事業所数(事業所)

l_pop: 対数変換した総人口数(人)

l_water: 対数変換した工業用水量(m3/日)

l_water_kachi: 対数変換した製造業付加価値額当りの工業用水量((m3/日)/百万円)

です。

cor()関数で相関係数を調べます。

f:id:cross_hyou:20211107084322p:plain

l_waterと一番相関が強いのは、l_water_kachiですね。次がl_kachiで、3番目がl_gdpです。

l_gdp, l_kachi, l_num, l_popはどれも相関が強いですね。

この相関係数を散布図にして見える化しましょう。

まずは、簡単な、pairs()関数を使う方法です。

f:id:cross_hyou:20211107085138p:plain

f:id:cross_hyou:20211107085152p:plain

続いて、PerformanceAnalyticsパッケージのchart.Correlation()関数を使ってみます。

f:id:cross_hyou:20211107085955p:plain

ヒストグラムと相関係数も同時に表示されます。

次は、psychパッケージのpairs.panel()関数を使ってみます。

f:id:cross_hyou:20211107090653p:plain

ヒストグラムの色が青いですね。

corrgramパッケージのcorrgram()関数を使ってみます。

f:id:cross_hyou:20211107091743p:plain

f:id:cross_hyou:20211107091800p:plain

corrplotパッケージのcorrplot.mixed()関数を使ってみましょう。

f:id:cross_hyou:20211107092603p:plain

f:id:cross_hyou:20211107092616p:plain

今回は

Correlation Plot in R ◤Correlogram◢ [WITH EXAMPLES] (r-coder.com)

を参考にしていろいろな相関係数マトリックスを作成しました。

 

次回は

 

www.crosshyou.info

です。

 

 

初めから読むには、

 

www.crosshyou.info

です。