Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の小学校費のデータの分析2 - R言語でヒストグラム、箱ひげ図、散布図を描く。

 

www.crosshyou.info

 の続きです。

今回は、県民一人当たりの小学校費と、県内総生産額に対する割合を算出してみましょう。

まず、都道府県財政の小学校費と市町村財政の小学校費を合計した変数を作ります。mutate関数を使ってみました。totalという変数名にしました。

f:id:cross_hyou:20210418114435p:plain

次に県民一人当たりの小学校費の変数を作ります。perという変数名にしました。

f:id:cross_hyou:20210418114741p:plain

mutate関数を使わないで、原始的なやり方で作ってみました。summary関数でみてみると、最大で県民一人当たり6万円ぐらい、最小で2万8千円ぐらい、平均値が4万3千円ぐらいです。

県内総生産額に対する割合を作ります。ratioという変数名にしました。

f:id:cross_hyou:20210418115513p:plain

一番割合の大きいところで1.9%、小さいところだと0.44%です。平均は1.2%です。

perヒストグラムをhist関数でみてみましょう。

f:id:cross_hyou:20210418120346p:plain

f:id:cross_hyou:20210418120400p:plain

正規分布のような山型の分布です。

ratioのヒストグラムもみてみましょう。

f:id:cross_hyou:20210418121327p:plain

f:id:cross_hyou:20210418121339p:plain

こちらも山型です。左になんか外れ値っぽいのがありますね。

boxplot関数で箱ひげ図もみてみましょう。

perの箱ひげ図です。

f:id:cross_hyou:20210418121629p:plain

f:id:cross_hyou:20210418121642p:plain

上方に外れ値があります。

ratioの箱ひげ図を見てみます。

f:id:cross_hyou:20210418121824p:plain

f:id:cross_hyou:20210418121837p:plain

下方に外れ値があります。上方に一つあるようです。

plot関数でperとratioの散布図を描いてみます。

f:id:cross_hyou:20210418122120p:plain

f:id:cross_hyou:20210418122137p:plain

perが大きいほどratioも大きいという正の相関関係があるようです。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。