Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の消防・教育・警察部門職員数のデータ分析1 - 教育部門の職員数は年々減少、消防と警察は増加傾向。

今回は、都道府県別の消防部門、教育部門、警察部門の職員数のデータを分析してみたいと思います。

データは、政府統計の総合窓口e-Statから取得しました。

www.e-stat.go.jp

選択したデータ項目は以下のとおりです。

f:id:cross_hyou:20200423105028j:plain

 

データのファイルは以下のようなものでした。

f:id:cross_hyou:20200423105058j:plain

 

このファイルをR言語のread.csv関数で読み込みます。

f:id:cross_hyou:20200423105210j:plain

 

na.omit関数でNAのある行を削除します。

f:id:cross_hyou:20200423105312j:plain

str関数でデータフレームdfの構造を確認します。

f:id:cross_hyou:20200423105450j:plain

470行・5列のデータフレームです。

 

summary関数で基本的な統計値をみてみます。

f:id:cross_hyou:20200423105621j:plain

都道府県の度数が10となっていますから、10年間分のデータがありますね。

 

Yearが2006年度、2007年度と「年度」がついています。これを年度を削除して、数値型のデータに変換します。

f:id:cross_hyou:20200423105829j:plain

上のコマンドは、substr関数でYearの1文字目から4文字目、すなわち数字の部分だけにしています。2番目のas.numeric関数で数値型に変更しています。そして、table関数で各年の度数を表示しています。

 

年度ごとの各変数の合計値を計算してグラフにしてみます。

tapply関数とsum関数で年度ごとの合計値を出して、plot関数でグラフにします。

f:id:cross_hyou:20200423112610j:plain

f:id:cross_hyou:20200423112620j:plain

人口は減少傾向です。

 

f:id:cross_hyou:20200423112736j:plain

f:id:cross_hyou:20200423112752j:plain

県内総生産額は、谷型です。

 

f:id:cross_hyou:20200423112931j:plain

f:id:cross_hyou:20200423112946j:plain

消防部門の職員数は毎年上昇しています。

 

f:id:cross_hyou:20200423113129j:plain

f:id:cross_hyou:20200423113142j:plain

教育部門の職員数は毎年減少しています。

 

f:id:cross_hyou:20200423113343j:plain

f:id:cross_hyou:20200423113357j:plain

警察部門の職員数は増加傾向です。

今回は以上です。