の続きです。
前回は、PC1台当りの生徒数は年度による違いは無いとわかりました。(2013年度と2015年度を比較しました。)
今回は都道府県別のPC1台当りの生徒数を反応変数にして、人口、面積、生徒数の3つの変数で重回帰分析をしてみます。
まずは、県別の人口のベクトルを作成します。tapply関数を使いました。
鳥取県が一番人口は少ないですね。
面積のベクトルを作成します。
香川県が一番面積が小さいです。
生徒数のベクトルを作成します。
これで、反応変数(PrCo), 説明変数(PrPo, PrAr, PrSe)ができました。これをまとめたデータフレームを作成します。data.frame関数です。
散布図マトリックスをpairs関数で作成します。
一番上の行の3つの散布図が、PrCo(PC1台当りの生徒数)を縦軸にした散布図です。
赤い線がほぼ水平なので、3つの説明変数とはあまり関連ないようですね。
mgcvパッケージのgam関数で、generalized additive modelで分析してみます。
それでは、lm関数で重回帰分析をしてみます。
p-valueが0.1828と0.05よりも大きいですからこのモデルは有意ではない、ということですね。PC1台当りの生徒数と人口や面積、生徒数は関係が無い、ってことですね。
今回は以上です。