www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

国籍別在留外国人数の分析3 - 増減のデータで散布図を描く(plot関数、ggplot関数)

今回は、国籍別在留外国人数のデータを使い、増減の散布図を描いてみましょう。

前回の分析までで、下図のようなR言語のデータフレームを作成しました。

f:id:cross_hyou:20181013094652j:plain

「地域」と「国籍」がカテゴリカル変数で、「平成26」「平成27」「平成28」がそれぞれの年の人数、「幅2627」と「幅2728」が増減幅、「率2627」「率2728」が増減率ですね。

「幅2627」と「幅2728」、「率2627」と「率2728」の組合せで散布図を描いてみましょう。簡単なのはplot関数です。

f:id:cross_hyou:20181013095651j:plain

par(mfrow=c(1,2)) というコマンドで、 1 X 2 のグラフウィンドウを立ち上げて、そのあとにplot関数で散布図を描きます。

 

左が増減幅で、右が増減率です。増減幅のほうは極端に値の大きいデータがあってよくわからないですが、増減率の散布図を見ると、どうやら26年-27年と27年-28年には正の相関関係があるようですね。

cor.test関数で相関係数を見てみましょう。

f:id:cross_hyou:20181013100818j:plain

一番下の行に、cor 0.5059927 とあります。これが率2627と率2728の相関係数です。

p-value = 0.001191 とあります。この値が0.05よりも小さいので、相関関係は有意といことです。

それではggplot関数で増減率の散布図を描いてみましょう。地域別に傾向はあるでしょうか?その前にlibrary(tidyverse)とコマンド入力をして、ggplot関数を使えるようにします。

f:id:cross_hyou:20181013101553j:plain

これでggplot関数が使えるようになりましたので、やってみましょう。

f:id:cross_hyou:20181013101742j:plain

color = 地域 として、地域別にプロット点を色分けします。

f:id:cross_hyou:20181013101830j:plain

アジアの国籍の伸び率が高いようですね。

size = 平成26 というコマンドも加えてみましょう。

f:id:cross_hyou:20181013103214j:plain

f:id:cross_hyou:20181013103228j:plain

プロットの大きさが人数の大きさを表しています。人数の多い国籍は伸び率は低いことがわかりますね。