www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の教育用PC1台当りの生徒数の分析3 - PC1台当りの生徒数と人口・面積・生徒数は関連が無い。

 

www.crosshyou.info

 の続きです。

前回は、PC1台当りの生徒数は年度による違いは無いとわかりました。(2013年度と2015年度を比較しました。)

今回は都道府県別のPC1台当りの生徒数を反応変数にして、人口、面積、生徒数の3つの変数で重回帰分析をしてみます。

まずは、県別の人口のベクトルを作成します。tapply関数を使いました。

f:id:cross_hyou:20190831152223j:plain

鳥取県が一番人口は少ないですね。

面積のベクトルを作成します。

f:id:cross_hyou:20190831152656j:plain

香川県が一番面積が小さいです。

生徒数のベクトルを作成します。

f:id:cross_hyou:20190831153000j:plain

これで、反応変数(PrCo), 説明変数(PrPo, PrAr, PrSe)ができました。これをまとめたデータフレームを作成します。data.frame関数です。

f:id:cross_hyou:20190831153355j:plain

散布図マトリックスをpairs関数で作成します。

f:id:cross_hyou:20190831153651j:plain

f:id:cross_hyou:20190831153701j:plain

一番上の行の3つの散布図が、PrCo(PC1台当りの生徒数)を縦軸にした散布図です。

赤い線がほぼ水平なので、3つの説明変数とはあまり関連ないようですね。

mgcvパッケージのgam関数で、generalized additive modelで分析してみます。

f:id:cross_hyou:20190831154235j:plain

f:id:cross_hyou:20190831154248j:plain

それでは、lm関数で重回帰分析をしてみます。

f:id:cross_hyou:20190831154855j:plain

p-valueが0.1828と0.05よりも大きいですからこのモデルは有意ではない、ということですね。PC1台当りの生徒数と人口や面積、生徒数は関係が無い、ってことですね。

今回は以上です。