今回は、都道府県別の消防部門、教育部門、警察部門の職員数のデータを分析してみたいと思います。
データは、政府統計の総合窓口e-Statから取得しました。
選択したデータ項目は以下のとおりです。
データのファイルは以下のようなものでした。
このファイルをR言語のread.csv関数で読み込みます。
na.omit関数でNAのある行を削除します。
str関数でデータフレームdfの構造を確認します。
470行・5列のデータフレームです。
summary関数で基本的な統計値をみてみます。
都道府県の度数が10となっていますから、10年間分のデータがありますね。
Yearが2006年度、2007年度と「年度」がついています。これを年度を削除して、数値型のデータに変換します。
上のコマンドは、substr関数でYearの1文字目から4文字目、すなわち数字の部分だけにしています。2番目のas.numeric関数で数値型に変更しています。そして、table関数で各年の度数を表示しています。
年度ごとの各変数の合計値を計算してグラフにしてみます。
tapply関数とsum関数で年度ごとの合計値を出して、plot関数でグラフにします。
人口は減少傾向です。
県内総生産額は、谷型です。
消防部門の職員数は毎年上昇しています。
教育部門の職員数は毎年減少しています。
警察部門の職員数は増加傾向です。
今回は以上です。