www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の旅行・行楽の年間行動者率のデータの分析3 - 年度によってデータに違いはあるのかR言語のANOVA分析で確認する。

 

www.crosshyou.info

 の続きです。前回のグラフで、旅行・行楽の年間行動者率は年度によって違いは無い感じでしたが、海外旅行は違いがある感じでした。

ANOVA分析で確認してみます。aov関数とanova関数を使います。

f:id:cross_hyou:20210111194036p:plain

p値が0.2539と0.05よりも大きいです。

年度によって旅行・行動者率に違いはありません。

海外旅行はどうでしょうか?

f:id:cross_hyou:20210111194217p:plain

p値が2.2e-16よりも小さいです。年度によって違いがあるということですね。

TukeyHSD関数を使いどの年度とどの年度が違うのかをみてみます。

f:id:cross_hyou:20210111194419p:plain

2001年と1996年の組み合わせの他は全てp値が0.05以下ですね。つまり違いがあるということです。

各年の平均値を計算してみます。

f:id:cross_hyou:20210111194557p:plain

group_by関数でyearごとにグループ化して、summarise関数でmean関数を使い平均値を出しています。se(標準誤差)や95%信頼区間もあわせて計算しました。

この平均値を棒グラフにしてみます。

f:id:cross_hyou:20210111200308p:plain

f:id:cross_hyou:20210111200326p:plain

geom_errorbar関数で信頼区間のエラーバーも表示しました。

1996年と2001年の信頼区間のエラーバーはかぶっていますが、その他はかぶっていないことがわかります。TukeyHSDの結果のとおりですね。

旅行・行楽の年間行動者率も年度ごとに平均値を出してみましょう。

f:id:cross_hyou:20210111200531p:plain

こちらも同じようにグラフにしてみます。

f:id:cross_hyou:20210111201213p:plain

f:id:cross_hyou:20210111201226p:plain

信頼区間のバーが全ての年度でかぶっていますね。ANOVA分析の結果と整合的です。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。