
Photo by Sajad Nori on Unsplash
の続きです。
今回は都道府県別の平均値のデータフレームを使って、回帰分析をしてみます。
まずは、east, big6, noseaというダミー変数を加えないで回帰分析してみます。
R言語のlm()関数を使います。

l_iryouは1%以下の水準で有意な変数ですね。人口密度と所得が固定されていたら、l_iryouが1増えると16ポイントも病床利用率が高くなるということですね。
iryouの平均値は、

28万8600円ですね。これから1000円医療費が増えたとすると、

となりますから0.06ポイント病床利用率が高くなるという計算です。
医療費が1%増えると病院病床利用率は16/100=0.16ポイント増加です。
残差プロットをみてみます。

残差のバラツキには特筆するような傾向はみられませんね。
残差の2乗がl_mitsudo, l_shotoku, l_iryouと関連性があるかを調べます。

F検定のp-valueは0.6928と0.05よりもうんと大きい値です。
つまり、誤差項は均一分散といえますね。
続いて、east, big6, noseaというダミー変数も加えて回帰分析してみます。

ダミー変数も加えてみると、l_iryouの傾きは11.87と小さくなり、p値も0.0545と10%水準で有意です。医療費が1%増えると、病床利用率は0.11ポイント増えるという解釈です。
残差プロットを描いてみます。


誤差項は不均一分散ではなさそうですね。
Breusch-Pagan Testで確認します。

p-valueは0.6761ですから誤差項は不均一分散とは言えないです。
今回は以上です。
次回は
です。
はじめから読むには
です。