Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のパスポート発行数のデータ分析4 - R言語で年による発行数、月による発行数に違いはあるかどうかを検定する。

 

www.crosshyou.info

 前回のグラフで、東京都のパスポート発行数は年によって、月によって発行数に違いがありそうなことがわかりました。

そこで、今回はR言語のaov関数、anova関数、TukeyHSD関数などを使って本当の年によって、月によって違いがあるのかどうか確認します。

まずは、年によって違いがあるかどうか。

f:id:cross_hyou:20201211170426p:plain

aov関数でANOVAのモデルオブジェクトを作り、anova関数で評価します。

p値が8.511e-05と0.05よりも小さいです。つまり、年によってパスポート発行数が違っていることになります。

aov関数とanova関数では、年によって違いがあることはわかりますが、どの年と年が違うのかはわからないです。

これは、TukeyHSD関数を使うとわかります。

f:id:cross_hyou:20201211171045p:plain

f:id:cross_hyou:20201211171100p:plain

青く囲った年の組み合わせがp値が0.05以下で有意に違う年です。

2013-2010, 2014-2010, 2016-2013, 2017-2013, 2017-2014, 2017-2015の組み合わせが有意にちがいます。

plot関数でグラフにしてみます。

f:id:cross_hyou:20201211171446p:plain

f:id:cross_hyou:20201211171500p:plain

青く囲った水平線が0の垂直線をまたいでいません。つまり、有意に差がある組み合わせです。

同じように、月をファクターにしてANOVA分析をしてみます。

f:id:cross_hyou:20201211171746p:plain

p値が4.111e-14と0.05よりも小さいので、月によってパスポート発行数に違いはあります。

TukeyHSD関数でどの月とどの月が違うのかを調べます。

f:id:cross_hyou:20201211172114p:plain

f:id:cross_hyou:20201211172415p:plain

f:id:cross_hyou:20201211172533p:plain

けっこういっぱい違う組み合わせがあります。

plot関数でグラフにします。

f:id:cross_hyou:20201211172816p:plain

f:id:cross_hyou:20201211172829p:plain

今回は以上です。

 次回は

 

www.crosshyou.info

 です。

第1回目は

 

www.crosshyou.info

 です。