Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の献血者数のデータの分析6 - やっぱりボランティア行動者率が上昇すると、献血者率が下がる。

f:id:cross_hyou:20210626081551j:plain

 Photo by dilara harmanci on Unsplash  

www.crosshyou.info

の続きです。

今回は、回帰分析の説明変数に2006年の献血者率を加えて、2011年の献血者率を回帰分析してみようと思います。

f:id:cross_hyou:20210626082150p:plain

blood_popをblood_pop_2016と名前を変更しておきましょう。

f:id:cross_hyou:20210626082410p:plain

続いて、2011年だけのデータフレームを作ります。

f:id:cross_hyou:20210626082552p:plain

このdf2006とdf2011をinner_join()関数で結合します。

f:id:cross_hyou:20210626083011p:plain

by = "pref" となっていますので、prefを基準にして結合したとわかります。
それでは、lm()関数で回帰分析をしてみます。

f:id:cross_hyou:20210626084002p:plain

p-valueは2.506e-07と0.05よりも小さな値ですので、有意なモデルです。

このモデルでもvolant: ボランティア行動者率は有意な変数で、-0.03466と符号がマイナスです。

誤差項がheteroscedasticity(不均一分散)なのかどうかを検定してみます。

f:id:cross_hyou:20210626084555p:plain

p-valueが0.4323と0.05よりも大きいので、誤差項はheteroscedasticity(不均一分散)とは言えないですね。

つまり、lm_model2は正しいモデルと言えます。

もういちど、coeftest関数でlm_model2の変数の係数をみてみます。

f:id:cross_hyou:20210626084918p:plain

volant: ボランティア行動者率が10ポイント上昇すると、献血者率は0.3ポイント下がる、ということですね。

volantの平均値、献血者率の平均値を再確認します。

f:id:cross_hyou:20210626085226p:plain

volantの平均値は28.03パーセント、献血者率の平均値は4.175%です。

今回は以上です。

はじめから読むには

 

www.crosshyou.info

 です。