Photo by Karsten Winegeart on Unsplash
の続きです。
今回は前回作成したワイド型のデータフレームを使って、各データの変化幅を計算していましょう。
mutate()関数を使います。
select()関数とsummary()関数を使って各変化幅のサマリーを確認します。
どの変化幅も減少している都道府県があることがわかります。
各変数の散布図マトリックスをみてみます。
各変化幅どうしの相関係数マトリックスをみてみます。
相関の強い組み合わせは、shotoku_1617とhoke_shoto_1617が-0.76で強い負の相関です。hokeN1718とhoke_shoto_1718が0.62とまあまあ強い正の相関です。
shotoku_1617とshotoku_1718のヒストグラムをみてみます。
2017年から2018年への所得の変化幅のほうが右寄りに分布が移動しているように見えます。
全体としては所得は増えたということですかね。
hoken_1617とhoken_1718の箱ひげ図を見てみます。
保険料の変化幅は2017年から2018年のほうがバラツキが大きいことがわかります。
hoke_shoto_1617とhoke_shoto_1718の散布図を見てみます。
切片0で傾きが-1の赤い線をabline()関数で引いてみました。保険料と所得の比率の変化幅は2016年から2017年と2017年と2018年で明確な傾向は見受けられません。
今回は以上です。
次回は、
です。
はじめから読むには、
です。