crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の老人福祉費と児童福祉費の分析1 - R言語で都道府県別の平均値を算出する。

今回は、都道府県別の老人福祉費と児童福祉費の分析をしてみようと思います。

データは、政府統計の総合窓口e-stat(www.e-stat.go.jp)から取得しました。

f:id:cross_hyou:20190926190817j:plain

取得したデータは5つです。総人口、総面積、県内総生産額、老人福祉費、児童福祉費です。

f:id:cross_hyou:20190926190908j:plain

ExcelのCSVファイルにこんな感じでダウンロードしました。

f:id:cross_hyou:20190926190946j:plain

R言語のread.csv関数でデータファイルを読込み、str関数で構造を確認します。無事に読み込んでいます。

まず、NAの行をomit.na関数で削除します。

f:id:cross_hyou:20190926191250j:plain

summary関数で平均値などを表示しています。NAが無くなっています。

年度と地域で全部そろっているか確認しましょう。table関数を使います。

f:id:cross_hyou:20190926191646j:plain

table関数を使う前にas.characcter関数とas.vector関数で年度の不要なファクタを削除しています。2006年度から2015年度の10年間ですべて47となっていますので47都道府県全部のデータがそろっています。

table関数をPrefでもやってみましょう。

f:id:cross_hyou:20190926192017j:plain

47都道府県すべて10個のデータがありますから、データはそろっていることが確認できました。

過去10年間平均の老人福祉費を都道府県別に調べましょう。tapply関数を使います。

f:id:cross_hyou:20190926192526j:plain

tapplyで都道府県別の平均値を計算し、avgOldというオブジェクトに格納しています。そして、sort関数で値の小さい順に表示しています。鳥取県が一番すくなく、169億8846万1千円です。東京都が2635億5029万6千円です。

児童福祉も同じようにtapply関数で調べましょう。

f:id:cross_hyou:20190926193419j:plain

香川県が児童福祉費は一番少ないですね。97億9266万7千円です。

東京都が一番多く、1980億1086万9千円です。児童福祉費よりも老人福祉費が多いのですね。

ついでに、総人口、総面積、県内総生産の10年間の平均値も出しておきましょう。

f:id:cross_hyou:20190926193929j:plain

総人口の一番少ないのは鳥取県です。58万8110人です。一番多いのは東京都で1313万8565人です。

f:id:cross_hyou:20190926194235j:plain

香川県が一番小さいです。18万7656haです。一番大きいのは北海道で、784万2076haです。

f:id:cross_hyou:20190926194544j:plain

県内総生産額は鳥取県が一番少ないです。11兆7960億35百万円です。

東京が一番多く102兆1295億28百万円です。

今回は以上です。