の続きです。前回のグラフで、旅行・行楽の年間行動者率は年度によって違いは無い感じでしたが、海外旅行は違いがある感じでした。
ANOVA分析で確認してみます。aov関数とanova関数を使います。
p値が0.2539と0.05よりも大きいです。
年度によって旅行・行動者率に違いはありません。
海外旅行はどうでしょうか?
p値が2.2e-16よりも小さいです。年度によって違いがあるということですね。
TukeyHSD関数を使いどの年度とどの年度が違うのかをみてみます。
2001年と1996年の組み合わせの他は全てp値が0.05以下ですね。つまり違いがあるということです。
各年の平均値を計算してみます。
group_by関数でyearごとにグループ化して、summarise関数でmean関数を使い平均値を出しています。se(標準誤差)や95%信頼区間もあわせて計算しました。
この平均値を棒グラフにしてみます。
geom_errorbar関数で信頼区間のエラーバーも表示しました。
1996年と2001年の信頼区間のエラーバーはかぶっていますが、その他はかぶっていないことがわかります。TukeyHSDの結果のとおりですね。
旅行・行楽の年間行動者率も年度ごとに平均値を出してみましょう。
こちらも同じようにグラフにしてみます。
信頼区間のバーが全ての年度でかぶっていますね。ANOVA分析の結果と整合的です。
今回は以上です。
次回は
です。
はじめから読むには、
です。