Photo by Tanner Geringer on Unsplash
の続きです。
今回は献血者数と各数値データの関係を見ていきましょう。
はじめは対数変換した人口との関係です。
geom_point()関数で散布図を描いて、geom_smooth(metho = "lm")で線形回帰の直線を重ねています。対数変換した人口が大きくなるほど献血者率は低下する傾向があるようです。
続いて、対数変換した県内総生産額との関係はどうでしょうか?
対数変換した県内総生産額が大きいほど、献血者率は低下する傾向があるようです。
人口当たりの県内総生産額との散布図を見てみます。
回帰直線が水平ですから、人口当たりの県内総生産額と献血者率は関係なさそうですね。
ボランティア活動行動者率との散布図を見てみます。
ボランティア活動行動者率が高いほど献血者率は低下しています。
これは意外な気がしました。ボランティアに熱心な人は献血にも前向きかと思ったんですが。。
cor()関数で各変数間の相関係数マトリックスをみてみます。
献血者率はどの変数とも相関は低いですね。
lpopとlgdpは0.982という高い相関係数です。
今回は以上です。
次回は
です。
はじめから読むには、
です。