今日は都道府県別の消防本部・署数のデータを分析してみます。
まず、e-Stat, 政府統計の総合窓口からデータを取得します。
今日は、このe-Statの「地方」の分類で、北海道から東海までを東日本、近畿から沖縄までを西日本として、東日本・西日本という観点からも分類したいと思います。
まずは、e-Statで地域を選択します。
データ項目は人口と消防本部・署数を選択しました。
このデータをダウンロードすると、こうなります。
このファイルをR言語のread.csv関数で読み込んで分析します。
read.csv関数でデータを読込み、na.omit関数でNAの行を削除し、str関数でデータフレームの構造を表示しています。観測は2021で変数は4ですね。
今回は、東日本、西日本というファイルも用意しました。
こういうファイルです。
これもread.csv関数で読込みます。
このewというデータフレームをdfというはじめのデータフレームと統合します。
merge関数を使います。
うまくいきました。
東日本、西日本でわけましたから、東日本・西日本別の平均の消防署数を算出してみます。tapply関数です。
東日本のほうが多いですね。
plot関数で東日本・西日本ごとの消防本部・署数の箱ひげ図を描いてみます。
東日本のほうが、都道府県での数の散らばりが大きいですね。
年度別の箱ひげ図を描いてみます。
平均値は上昇していますが、一番上の外れ値は年々低下しています。
一番数が多いところを見てみましょう。order関数とrev関数、head関数を組み合わせます。
多いのは北海道、少ないのは鳥取県ですね。
10000 * Shoubou / Pop を計算して1万人あたりの消防本部・署数の数を計算しましょう。
summary関数で平均値などを計算しました。
平均すると、1万人あたり0.5くらいの数の消防本部・署があるのですね。
tapply関数で東日本・西日本別の平均値を出しましょう。
西日本が0.495、東日本は0.548です。同じくらいになりました。
箱ひげ図を描いてみましょう。
こんな感じです。
head関数、rev関数、order関数を組み合わせて、1万人たりの消防本部・署の数の多い順、少ない順をみてみましょう。
北海道が多い、鳥取が少ないというのは同じですが、東京島が少ないほうに顔を出しています。
2017年度だけにしぼってやってみましょう。
2017年度だけに絞ると、秋田県が一番数が多く、島根、北海道と続きます。少ないほうでは、東京都が一番少なく、埼玉、大阪と続きます。人口が少ない県のほうが1万人当りの数は多いような気がします。
2017年度だけのデータで人口と1万人当りの数の散布図を描いてみましょう。
赤い丸が西日本で、緑の丸が東日本です。人口が多いほど、1万人当りの数は減りますね。
最後に、東日本と西日本で1万人当りの消防本部・署数に差があるのか検定してみます。
東日本が24、西日本が23と30よりも数が少ないので、wilcox.test関数を使いました。
p-value = 0.5906となりましたので、東日本と西日本で有意な差は無いとわかります。