Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

出入国管理統計の分析4 - 空港か港か x 日本人か外国人か のクロス表と 出国か入国か x 日本人か外国人か のクロス表

今回は前回の続きで、空港か港か x 日本人か外国人か のクロス表と 出国か入国か x 日本人か外国人か のクロス表を作成して連関を分析します。

まずは、read.csv関数でデータをR言語で読込み、summaru関数でデータのサマリーを表示します。

f:id:cross_hyou:20180630124021j:plain

出国者または入国者が0の港・空港がありましたので、subset関数で人数が0の行は削除しています。

それでは、空港か港 x 国籍 のクロス表を作成してみましょう。table関数で作成します。

f:id:cross_hyou:20180630124518j:plain

空港よりも港のほうが外国人の比率が高いような気がします。比率で表示してみましょう。prop.table関数を使います。

f:id:cross_hyou:20180630124739j:plain

空港では、外国人は52%ですが、港では外国人は64%です。

カイ自乗検定で有意な違いなのか検定します。chisq.test関数です。

f:id:cross_hyou:20180630125052j:plain

p-value = 0.06089 > 0.05 なので帰無仮説「空港・港と外国人・日本人は関連が無い」を棄却できません。

続いて、出国か入国か x 日本人か外国人か のクロス表を作成します。

f:id:cross_hyou:20180630125503j:plain

出国の入国も外国人のほうが多いですね。比率で表示してみます。

f:id:cross_hyou:20180630125900j:plain

ほとんど違いはないですね。カイ自乗検定をしてみます。

f:id:cross_hyou:20180630130147j:plain

p-value = 0.8188 > 0.05 ですから、帰無仮説「出国・入国と日本人・外国人は関連性はない」を棄却できませんでした。