Photo by Sajad Nori on Unsplash
の続きです。
今回は都道府県別の平均値のデータフレームを使って、回帰分析をしてみます。
まずは、east, big6, noseaというダミー変数を加えないで回帰分析してみます。
R言語のlm()関数を使います。
l_iryouは1%以下の水準で有意な変数ですね。人口密度と所得が固定されていたら、l_iryouが1増えると16ポイントも病床利用率が高くなるということですね。
iryouの平均値は、
28万8600円ですね。これから1000円医療費が増えたとすると、
となりますから0.06ポイント病床利用率が高くなるという計算です。
医療費が1%増えると病院病床利用率は16/100=0.16ポイント増加です。
残差プロットをみてみます。
残差のバラツキには特筆するような傾向はみられませんね。
残差の2乗がl_mitsudo, l_shotoku, l_iryouと関連性があるかを調べます。
F検定のp-valueは0.6928と0.05よりもうんと大きい値です。
つまり、誤差項は均一分散といえますね。
続いて、east, big6, noseaというダミー変数も加えて回帰分析してみます。
ダミー変数も加えてみると、l_iryouの傾きは11.87と小さくなり、p値も0.0545と10%水準で有意です。医療費が1%増えると、病床利用率は0.11ポイント増えるという解釈です。
残差プロットを描いてみます。
誤差項は不均一分散ではなさそうですね。
Breusch-Pagan Testで確認します。
p-valueは0.6761ですから誤差項は不均一分散とは言えないです。
今回は以上です。
次回は
です。
はじめから読むには
です。