今回は、国籍別在留外国人数のデータを分析してみようと思います。
データの元は、総務省統計局のホームページです。
ホーム > 統計データ > 日本の統計 > 本書の内容 > 第2章 人口・世帯 > 2-8 国籍別在留外国人数
です。
http://www.stat.go.jp/data/nihon/02.html
実際のエクセルファイルはこんなものでした。
これを少し加工して、このようなCSVファイルにしました。
「総数」の行を削除して、「地域」の列を追加しました。
このCSVファイルをread.csv関数でR言語に読みこみ、summary関数で基本の統計量を算出しましょう。
地域別の国数は、アジアが一番多くて15か国、次がヨーロッパの11か国、アフリカ、北アメリカ、南アメリカが3か国で、オセアニアが2か国、無国籍もあります。
国籍は全部で38ですね。人数を見ると、平均が平成26年で5万4557人、平成27年が5万6407人、平成28年が6万0267人と年々増加していることがわかります。地域別ではどの地域が増加しているのか?国別ではどうか?などを調べていきましょう。
summary関数では標準偏差が計算されないので、apply関数とsd関数で標準偏差を計算しましょう。
by関数を使って、地域別の基本統計値を計算しましょう。
平均値の推移に注目すると、南アフリカとオセアニアは平成27年に減少していますが、それ以外の地域は27年、28年と年々増加しています。