県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析をします。
まずは、政府統計の総合窓口(www.s-stat.go.jp)からデータを取得します。
このように、特別区、県庁所在市、政令指定都市を指定します。74地域あります。
データ項目として、総人口(人)、総面積(ha)、課税対象所得(千円)、一般行政部門職員数(人)を選択して、CSVファイルにダウンロードします。
こんな感じです。このファイルをR言語のread.csv関数で読込みます。
こうなりました。Yearは年度ですが、2000年、2005年、2010年、2015年の4年のデータがあるようですね。不要なファクタ水準を整理します。
あ、2000年度だけ観測数が73ですね。2000年度を削除したデータフレームを作成します。
さきほどと同じようにして、Yearの2000年度という水準を削除します。
これで、欠損の無いデータフレームができました。
人口の分布を見てみましょう。2015年の最新の人口のヒストグラムや箱ひげ図、小さい順に並べたグラフを描きます。まずは、関数を作成します。
みっつグラフを描くので、san()という関数名で定義しました。それぞれのグラフに赤線で平均値、青線で中央値を引くようにしました。
それでは、2015年度の人口(Popu)をグラフにします。
人口はヒストグラムを見ると、右側に裾野が広がっている分布ですね。
面積はどうでしょうか?
面積も人口ほどではないですが、右の裾野が広がっています。
課税対象所得はどうでしょうか?
課税対象所得も前の二つと同じで右側に裾野が広がっています。
最後の一般行政職員数はどうでしょうか?
一般行政職員数も同じですね。
県庁所在市、政令指定都市、東京都特別区の合計74地域は規模にかなりの格差があることがわかりました。
それでは、それぞれのデータ項目の大きいところ、小さいところを見てみます。
tapply関数で2015年度の地域別の平均値を出して、sort関数で並び替えました。2015年度は各地域一つの値しかありませんから平均値=その年度の値になりま。なので、平均値でなくても最小値でも最大値でも中央値でも同じです。東京都千代田区が一番人口が少なく5万8406人、神奈川県横浜市が一番多く372万4844人です。
面積はどうでしょうか?
面積は東京都台東区が一番小さく1011haで、静岡県浜松市が一番広く15万5806haです。今回はtapply関数にmin関数を使いました。
課税対象所得はどうでしょうか?
課税所得が少ないのは鳥取県鳥取市で、2141億7015万5千円です。一番多いのは神奈川県横浜市で、7兆0839憶9176万8千円です。
一般行政職員数をみます。
職員数が一番少ないのは、東京都千代田区で840人です。一番多いのは大阪府大阪市で1万5097人です。
今回はここまでです。神奈川県横浜市は規模が大きいです。