の続きです。今回はボランティア活動行動者率を反応変数に、人口や面積、県内総生産を説明変数にして回帰分析をしてみようと思います。
まずは、X軸に説明変数(人口や面積、県内総生産)、Y軸に反応変数(行動者率)とした散布図を描いてみます。
まずは、人口(POP)との散布図です。
黒の点は2006年度、赤の点は2011年度です。人口が多いほうがボランティア活動行動者比率は低い傾向でしょうか?
人口の対数をX軸にしてみます。
対数値をとった散布図のほうがいいのかな?
とりあえず、両方試してみます。
まずは、人口で回帰したモデルです。
p-valueは1.374e-07と0.05よりも小さく有意なモデルです。R-squaredは0.2616、POPの係数の符号はマイナスですから、人口が多いほど、行動者率は低いです。
人口の対数値で回帰したモデルです。p-value は9.204e-08と、さらに小さい値で、R-squaredは0.2679とさらに大きい値です。対数をとったほうがいいのかな?
次は、面積を説明変数にします。まずは散布図です。
一番右の二つの点、北海道だと思うのですが、この二つの点が目立ってしまってよくわからないですね。これも対数変換してみます。
面積と行動者率は関係なさそうですね。対数値でないモデル、対数値のモデルの両方を調べてみます。
面積で回帰したモデルです。
p-valueが0.4176と0.05よりもずっと大きいです。有意なモデルではないです。
面積の対数値で回帰したモデルです。p-valueは0.1313とこらも0.05よりも大きいので有意なモデルではないです。面積はボランティア活動行動者率とは関係ないですね。
県内総生産との散布図を描きます。一度に対数値をとった散布図も描いてしまいます。
GDPが大きいほど、行動者比率は下がっているように見えます。lm関数で回帰分析します。
まずは対数値をとらないモデルです。
p-value = 3.906e-05なので0.05よりも小さい値ですから、有意なモデルです。GDPの係数の符号はマイナスですから、GDPが大きいほど、ボランティア活動行動者比率は下がります。
GDPの対数値で回帰したモデルです。p-valueは7.453e-07でさらに小さく、R-squaredは0.2348とさらに大きくなりました。
ここまで6つのモデルを調べました。p-valueの小さい順に並べてみます。
model2(人口の対数値) 9.204e-08
model1(人口) 1.374e-07
model6(県内総生産の対数値) 7.453e-07
model5(県内総生産) 3.906e-05
model4(面積の対数値) 0.1313
model3(面積) 0.4176
ということです。
残差プロットを見てみます。
今回は以上です。