www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の後期高齢者医療制度被保険者実態調査のデータ分析4 - 各変数の変化幅を計算してグラフにする。

f:id:cross_hyou:20210724115408j:plain

 Photo by Karsten Winegeart on Unsplash  

www.crosshyou.info

 の続きです。

今回は前回作成したワイド型のデータフレームを使って、各データの変化幅を計算していましょう。

mutate()関数を使います。

f:id:cross_hyou:20210724120246p:plain

select()関数とsummary()関数を使って各変化幅のサマリーを確認します。

f:id:cross_hyou:20210724120504p:plain

どの変化幅も減少している都道府県があることがわかります。

各変数の散布図マトリックスをみてみます。

f:id:cross_hyou:20210724120731p:plain

f:id:cross_hyou:20210724120742p:plain

各変化幅どうしの相関係数マトリックスをみてみます。

f:id:cross_hyou:20210724121012p:plain

相関の強い組み合わせは、shotoku_1617とhoke_shoto_1617が-0.76で強い負の相関です。hokeN1718とhoke_shoto_1718が0.62とまあまあ強い正の相関です。

shotoku_1617とshotoku_1718のヒストグラムをみてみます。

f:id:cross_hyou:20210724122039p:plain

f:id:cross_hyou:20210724122053p:plain

2017年から2018年への所得の変化幅のほうが右寄りに分布が移動しているように見えます。

全体としては所得は増えたということですかね。

hoken_1617とhoken_1718の箱ひげ図を見てみます。

f:id:cross_hyou:20210724122612p:plain

f:id:cross_hyou:20210724122623p:plain

保険料の変化幅は2017年から2018年のほうがバラツキが大きいことがわかります。

hoke_shoto_1617とhoke_shoto_1718の散布図を見てみます。

f:id:cross_hyou:20210724123133p:plain

f:id:cross_hyou:20210724123143p:plain

切片0で傾きが-1の赤い線をabline()関数で引いてみました。保険料と所得の比率の変化幅は2016年から2017年と2017年と2018年で明確な傾向は見受けられません。

今回は以上です。

次回は、

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。