crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の小学校費のデータの分析5 - 総人口、小学校数が多いほど小学校費の県内総生産額に対する割合は高い。

 

www.crosshyou.info

 の続きです。

前回の分析では、小学校費の県内総生産額に対する割合は、人口や県内総生産額とは無関係だとわかりました。

そこで、今回は小学校の数を説明変数に加えてみます。

まず、政府統計の総合窓口、www.e-stat.go.jp のサイトからデータをダウンロードします。

f:id:cross_hyou:20210425081946p:plain

こういうデータですね。

f:id:cross_hyou:20210425082234p:plain

こんな感じのCSVファイルです。10行目に変数名を挿入しています。

このCSVファイルを読み込みます。

f:id:cross_hyou:20210425082610p:plain

このschoolのデータのschoolをdf_2014にcbind関数をつかって追加します。

f:id:cross_hyou:20210425082859p:plain

これで、ratio: 小学校費が県内総生産額に占める割合をpop: 総人口、gdp: 県内総生産額、school: 小学校数で回帰分析します。総人口と県内総生産額が同じならば、小学校数が多いほど、小学校費の県内総生産額に対する割合は大きくなるはずです。

f:id:cross_hyou:20210425083327p:plain

schoolの係数は4.424e-04と正の符号ですから小学校数が多いほどratioは大きくなります。しかし、p値は0.1238と有意ではないですね。

説明変数を対数にして回帰分析してみます。

f:id:cross_hyou:20210425083934p:plain

全ての説明変数が有意になりましたね!

pop: 総人口、school: 小学校数は大きい値ほどratio: 小学校費の県内総生産額に対する割合は大きい値になり、gdp: 県内総生産額が大きいほどratioは小さい値になります。

今回は以上です。

はじめから読むには、

 

www.crosshyou.info

 です。