Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

国籍別在留外国人数の分析4 - 地域によって増減率に違いはあるだろうか?

今回は、国籍別在留外国人数のデータを使って、地域によって増減率に違いはあるだろうか?ということを検証したいと思います。

R言語にこんな形でデータフレームを作成しています。

f:id:cross_hyou:20181013170708j:plain

地域としてはアジアが15か国、ヨーロッパが11か国と多いので、この2つの地域で比較してみましょう。

まずは、アジア地域の増減率を表すベクトルを作成しましょう。

f:id:cross_hyou:20181013171117j:plain

次に、ヨーロッパ地域の増減率を表すベクトルを作成します。

f:id:cross_hyou:20181013171433j:plain

アジアのデータは15個、ヨーロッパのデータは11個と30個以下ですから平均値に差があるかではなくて、分布の位置に差があるかを調べましょう。

両方の中央値を見てみます。median関数です。

f:id:cross_hyou:20181013171733j:plain

アジアのほうは12.38%で、ヨーロッパのほうは8.05%ですから、アジアのほうが増減率が高いようですね。

ヒストグラムで確認します。hist関数です。

f:id:cross_hyou:20181013172054j:plain

f:id:cross_hyou:20181013172125j:plain

ヒストグラムの形状は、アジアのほうが右側に重心があるのがわかりますね。

それでは、検定をしましょう。ウィルコクソン=マン・ホイットニー検定です。関数はwilcox.testです。

f:id:cross_hyou:20181013172552j:plain

p-value = 0.443 > 0.05 ですからアジアとヨーロッパの増減率に違いは認められません。

平成27年から平成28年の増減率でも同じようにやってみます。

f:id:cross_hyou:20181013173143j:plain

平成27年から平成28年では、アジアの増減率の中央値は9.23%で、ヨーロッパは6.9%です。アジアのほうが伸びていますね。

ヒストグラムでもみてみます。

f:id:cross_hyou:20181013173534j:plain

hist関数で、breaks=c(-20,-10,0,10,20,30,40,50)というの加えてヒストグラムの範囲を指定しています。

f:id:cross_hyou:20181013173636j:plain

ヒストグラムにするとアジアのほうが伸び率が高い国籍が多いことがわかりますね。

では、wilcox.test関数でウィルコクソン=マン・ホイットニー検定をしてみます。

f:id:cross_hyou:20181013173903j:plain

p-value = 0.09726 > 0.05 ですから平成27年から平成28年でも両者に違いがあるとは言えません。データ数が少ないともっとはっきり違いがないとダメなんですね。

ということで、最後に平成26年から平成27年平成27年から平成28年を結合したベクトルを作成して比較してみましょう。

f:id:cross_hyou:20181013174305j:plain

アジアの増減率の中央値は10.805%で、ヨーロッパは7.655%です。

ヒストグラムでも確認しましょう。

f:id:cross_hyou:20181013174602j:plain

f:id:cross_hyou:20181013174613j:plain

アジアのほうが高い伸び率の観測値が多いことがわかります。

それでは、ウィルコクソン=マン・ホイットニー検定をしてみましょう。

f:id:cross_hyou:20181013174827j:plain

p-value = 0.05716 > 0.05 ですから、両者の分布位置に違いがあるとは言えません。