前回のグラフで、東京都のパスポート発行数は年によって、月によって発行数に違いがありそうなことがわかりました。
そこで、今回はR言語のaov関数、anova関数、TukeyHSD関数などを使って本当の年によって、月によって違いがあるのかどうか確認します。
まずは、年によって違いがあるかどうか。
aov関数でANOVAのモデルオブジェクトを作り、anova関数で評価します。
p値が8.511e-05と0.05よりも小さいです。つまり、年によってパスポート発行数が違っていることになります。
aov関数とanova関数では、年によって違いがあることはわかりますが、どの年と年が違うのかはわからないです。
これは、TukeyHSD関数を使うとわかります。
青く囲った年の組み合わせがp値が0.05以下で有意に違う年です。
2013-2010, 2014-2010, 2016-2013, 2017-2013, 2017-2014, 2017-2015の組み合わせが有意にちがいます。
plot関数でグラフにしてみます。
青く囲った水平線が0の垂直線をまたいでいません。つまり、有意に差がある組み合わせです。
同じように、月をファクターにしてANOVA分析をしてみます。
p値が4.111e-14と0.05よりも小さいので、月によってパスポート発行数に違いはあります。
TukeyHSD関数でどの月とどの月が違うのかを調べます。
けっこういっぱい違う組み合わせがあります。
plot関数でグラフにします。
今回は以上です。
次回は
です。
第1回目は
です。