Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の医療施設調査の病院数のデータ分析4 - 病院数と人口10万人当たりの病院数の回帰分析をRのlm()関数で実行する。

UnsplashFlorentina Tilvicが撮影した写真 

www.crosshyou.info

今回は、病院数と人口10万人当たりの病院数の関係性をみてみましょう。

まず、散布図を描きます。

ggplot() + geom_point()関数で散布図を作成しました。

あんまり関係なさそうです。

今回は lm()関数で回帰分析をしてみます。

まずは、per10: 人口10万人当たりの病院数と、y2019: 2019年の病院数とその2乗のモデル、per10 ~ y2019 + I(y2019^2) を推定してみます。

summary()関数で結果を見てみましょう。

p-value: 0.5375 となっているので、per10とy2019は、やっぱり関係ないようですね。

こんどは、per10 ~ I(y2019^2) のモデルを推定してみましょう。

summary()関数で結果を見てみます。

p-value: 0.2973 とありますので、統計的に有意なモデルでは無いということですね。

こんどは、per10 ~ y2019 というモデルを推定してみます。

summary()関数で結果を見ましょう。

p-value: 0.3688 です。p-value: 0.05 よりもはるかに大きな値ですね。

次は、散布図に各モデルの推計値の線を重ねてみます。

まずは、仮想のy2019の値のベクトルを作ります。

range()関数でy2019の最小・最大を確認して、seq()関数で43~638の範囲で100個の数値のベクトルを作りました。

この値から、各モデルの推定値をpredict()関数で生成します。

それでは、plot()関数、lines()関数、legend()関数を使って散布図に推定値の線を重ねてみます。

3つの線はそれほど変わらない感じですね。

今回は以上です。病院の数と人口10万人当たりの病院数は関係なさそうでした。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。