crosshyou

主にクロス表(分割表)分析をしようかなと思います。

国籍別在留外国人数の分析1 - 基本統計量

今回は、国籍別在留外国人数のデータを分析してみようと思います。

データの元は、総務省統計局のホームページです。

ホーム > 統計データ > 日本の統計 > 本書の内容 > 第2章 人口・世帯 > 2-8 国籍別在留外国人数 

です。

http://www.stat.go.jp/data/nihon/02.html

f:id:cross_hyou:20181011202541j:plain

実際のエクセルファイルはこんなものでした。

f:id:cross_hyou:20181011202557j:plain

これを少し加工して、このようなCSVファイルにしました。

f:id:cross_hyou:20181011203931j:plain

「総数」の行を削除して、「地域」の列を追加しました。

このCSVファイルをread.csv関数でR言語に読みこみ、summary関数で基本の統計量を算出しましょう。

f:id:cross_hyou:20181011204539j:plain

地域別の国数は、アジアが一番多くて15か国、次がヨーロッパの11か国、アフリカ、北アメリカ、南アメリカが3か国で、オセアニアが2か国、無国籍もあります。

国籍は全部で38ですね。人数を見ると、平均が平成26年で5万4557人、平成27年が5万6407人、平成28年が6万0267人と年々増加していることがわかります。地域別ではどの地域が増加しているのか?国別ではどうか?などを調べていきましょう。

summary関数では標準偏差が計算されないので、apply関数とsd関数で標準偏差を計算しましょう。

f:id:cross_hyou:20181011205251j:plain

by関数を使って、地域別の基本統計値を計算しましょう。

f:id:cross_hyou:20181011211156j:plain

f:id:cross_hyou:20181011211219j:plain

平均値の推移に注目すると、南アフリカオセアニア平成27年に減少していますが、それ以外の地域は27年、28年と年々増加しています。