UnsplashのFlorentina Tilvicが撮影した写真
今回は、病院数と人口10万人当たりの病院数の関係性をみてみましょう。
まず、散布図を描きます。
ggplot() + geom_point()関数で散布図を作成しました。
あんまり関係なさそうです。
今回は lm()関数で回帰分析をしてみます。
まずは、per10: 人口10万人当たりの病院数と、y2019: 2019年の病院数とその2乗のモデル、per10 ~ y2019 + I(y2019^2) を推定してみます。
summary()関数で結果を見てみましょう。
p-value: 0.5375 となっているので、per10とy2019は、やっぱり関係ないようですね。
こんどは、per10 ~ I(y2019^2) のモデルを推定してみましょう。
summary()関数で結果を見てみます。
p-value: 0.2973 とありますので、統計的に有意なモデルでは無いということですね。
こんどは、per10 ~ y2019 というモデルを推定してみます。
summary()関数で結果を見ましょう。
p-value: 0.3688 です。p-value: 0.05 よりもはるかに大きな値ですね。
次は、散布図に各モデルの推計値の線を重ねてみます。
まずは、仮想のy2019の値のベクトルを作ります。
range()関数でy2019の最小・最大を確認して、seq()関数で43~638の範囲で100個の数値のベクトルを作りました。
この値から、各モデルの推定値をpredict()関数で生成します。
それでは、plot()関数、lines()関数、legend()関数を使って散布図に推定値の線を重ねてみます。
3つの線はそれほど変わらない感じですね。
今回は以上です。病院の数と人口10万人当たりの病院数は関係なさそうでした。
次回は、
です。
初めから読むには、
です。