の続きです。
今回はR言語のlm関数で回帰分析をしてみます。
2017年の医療費の伸びを2016年と2015年の伸びで回帰分析します。
まず、df_totalの列名が2015年度、2016年度、2017年度と数字がはじめの文字になっているのをrename関数で変更しておきます。
lm関数で回帰分析モデルを作成します。
p-valueは2.44e-08で有意なモデルです。Y2015, Y2016のp値も0.05以下なので有意です。
2017年度の伸び率 = 0.8088 + 0.4122 * 2015年度の伸び率 + 0.4130 * 2016年度の伸び率
というモデル式です。
モデルから得られる予測値と、実際の値の散布図を描いてみます。
まず、pというggplotオブジェクトを作りました。このpにいろいろ加えます。
埼玉県や千葉県は伸び率が高く、秋田県や岩手県、福島県は伸び率が低いですね。
地域区分で色分けした散布図を描いてみます。
東日本と西日本で分類してみます。
東日本と西日本で明確な違いはなさそうです。
日本海側と太平洋側とその他ではどうでしょうか?
これも明確な違いはなさそうです。
今回は以上です。