Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の一般病院病床利用率のデータ分析6 - R言語のlm()関数で回帰分析をする。医療費が高いところは病床利用率も高い。

f:id:cross_hyou:20210828075310j:plain

 Photo by Sajad Nori on Unsplash  

www.crosshyou.info

 の続きです。

今回は都道府県別の平均値のデータフレームを使って、回帰分析をしてみます。

まずは、east, big6, noseaというダミー変数を加えないで回帰分析してみます。

R言語のlm()関数を使います。

f:id:cross_hyou:20210828075849p:plain

l_iryouは1%以下の水準で有意な変数ですね。人口密度と所得が固定されていたら、l_iryouが1増えると16ポイントも病床利用率が高くなるということですね。

iryouの平均値は、

f:id:cross_hyou:20210828080346p:plain

28万8600円ですね。これから1000円医療費が増えたとすると、

f:id:cross_hyou:20210828080939p:plain

となりますから0.06ポイント病床利用率が高くなるという計算です。

医療費が1%増えると病院病床利用率は16/100=0.16ポイント増加です。

残差プロットをみてみます。

f:id:cross_hyou:20210828081512p:plain

残差のバラツキには特筆するような傾向はみられませんね。

残差の2乗がl_mitsudo, l_shotoku, l_iryouと関連性があるかを調べます。

f:id:cross_hyou:20210828082233p:plain

F検定のp-valueは0.6928と0.05よりもうんと大きい値です。

つまり、誤差項は均一分散といえますね。

続いて、east, big6, noseaというダミー変数も加えて回帰分析してみます。

f:id:cross_hyou:20210828082954p:plain

ダミー変数も加えてみると、l_iryouの傾きは11.87と小さくなり、p値も0.0545と10%水準で有意です。医療費が1%増えると、病床利用率は0.11ポイント増えるという解釈です。

残差プロットを描いてみます。

f:id:cross_hyou:20210828083308p:plain

f:id:cross_hyou:20210828083342p:plain

誤差項は不均一分散ではなさそうですね。

Breusch-Pagan Testで確認します。

f:id:cross_hyou:20210828083513p:plain

p-valueは0.6761ですから誤差項は不均一分散とは言えないです。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには

 

www.crosshyou.info

 です。