Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の一般病院病床利用率のデータ分析5 - R言語で散布図マトリックスを描くのと相関係数マトリックスを作る。

f:id:cross_hyou:20210826201305j:plain

 Photo by Tanya Grypachevskaya on Unsplash  

www.crosshyou.info

の続きです。

まず、R言語のgroup_by()関数とsummarize()関数を使って、年ごとの平均値を計算してみます。

f:id:cross_hyou:20210826201542p:plain

2002年、2005年、2008年、2011年、2014年と3年ごとに5年間ぶんのデータがあったのですね。

それぞれの変数の推移をグラフにしてみます。

f:id:cross_hyou:20210826201847p:plain

f:id:cross_hyou:20210826201915p:plain

ggplot2パッケージのggplot()関数とgeom_line()関数で折れ線グラフを作っておいて、gridExpandパッケージを読み込んで、grid.arrange()関数で4つのグラフをひとつにして表示しました。

病床利用率と人口密度は右肩下がり、所得は2008年に(おそらくリーマンショックの影響)落ち込みましたが、右肩上がり、医療費も右肩上がりです。

続いて、group_by()関数とsummarize()関数で都道府県別の平均値のデータフレームを作ります。

f:id:cross_hyou:20210826202304p:plain

この都道府県別の平均値のデータフレームを利用して、散布図マトリックスを描いてみます。pairs()関数を使いました。

f:id:cross_hyou:20210826202446p:plain

f:id:cross_hyou:20210826202458p:plain

病床利用率と他の変数との散布図は一番上の列です。

人口密度とは無相関、所得とは弱い負の相関、医療費とは弱い正の相関といったところでしょうか?

cor()関数で相関係数マトリックスをみてみます。

f:id:cross_hyou:20210826202736p:plain

病床利用率と人口密度の対数値の相関は-0.029, 

病床利用率と1人当たり県民所得の対数値の相関は-0.222,

病床利用率と1人当たり医療費の対数値の相関は0.544です。

一番相関係数(絶対値ベース)の大きい組み合わせは、人口密度と1人当たり県民所得の対数値ですね、0.639です。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

 

はじめから読むには

 

www.crosshyou.info

 です。