の続きです。
前回までの分析で、2006年度と2011年度では、趣味・娯楽の平均時間に有意な違いが無い、ということがわかりました。趣味・娯楽の平均時間は、男性か女性か、有業者か無業者かで違いがあることもわかりました。今回は性別と有業・無業のintaractionsを考慮してみます。
まずは、都道府県別に、2006年度の値と2011年度の値の平均値のデータを作ります。
4つの変数に対して、tapply関数で都道府県別の平均値のベクトルを作成しました。
これを4つ合わせます。
趣味・娯楽の時間の長さなので、変数名をMinutesにしました。平均値は46.61分です。
hist関数でヒストグラムを描いてみましょう。
2つの山がある形状のヒストグラムです。
男性・女性を表すベクトルを作成しましょう。MinutesはMaWo(男性・有業), MaFr(男性・無業), FeWo(女性・有業), FeFr(女性・無業)の順番で結合しましたから、始めの47 x2 = 94が男性、残りの94が女性です。
有業者・無業者を表す変数(ベクトル)も作成します。有業者47個、無業者47個、有業者47個、無業者47個の順番です。
これで、被説明変数Minutes, 説明変数GendarとJobが用意できました。
ここからは、Michael J. Crawley の Statistics: An Introduction using R を参考にして分析をしてみようと思います。
P168 のFactorial Experiments のところが参考になります。
まずは、barplot関数で棒グラフを描いてみます。
男性・無業者が一番長く、次は女性・無業者、3番目が男性・有業者、一番短いのは女性・有業者だとわかります。barplot関数をはずして数値でもみてみます。
女性・無業者は43分、男性・無業者は74分、女性・有業者は27分、男性・有業者は40分ほどです。
今回は以上です。