www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の趣味・娯楽の平均時間のデータ分析4 - R言語のbarplot関数で、性別 x 仕事の有無 の棒グラフを作成する

 

www.crosshyou.info

 の続きです。

前回までの分析で、2006年度と2011年度では、趣味・娯楽の平均時間に有意な違いが無い、ということがわかりました。趣味・娯楽の平均時間は、男性か女性か、有業者か無業者かで違いがあることもわかりました。今回は性別と有業・無業のintaractionsを考慮してみます。

まずは、都道府県別に、2006年度の値と2011年度の値の平均値のデータを作ります。

f:id:cross_hyou:20200307120703p:plain

4つの変数に対して、tapply関数で都道府県別の平均値のベクトルを作成しました。

これを4つ合わせます。

f:id:cross_hyou:20200307121142p:plain

趣味・娯楽の時間の長さなので、変数名をMinutesにしました。平均値は46.61分です。

hist関数でヒストグラムを描いてみましょう。

f:id:cross_hyou:20200307121401p:plain

f:id:cross_hyou:20200307121412p:plain

2つの山がある形状のヒストグラムです。

男性・女性を表すベクトルを作成しましょう。MinutesはMaWo(男性・有業), MaFr(男性・無業), FeWo(女性・有業), FeFr(女性・無業)の順番で結合しましたから、始めの47 x2 = 94が男性、残りの94が女性です。

f:id:cross_hyou:20200307122539p:plain


有業者・無業者を表す変数(ベクトル)も作成します。有業者47個、無業者47個、有業者47個、無業者47個の順番です。

f:id:cross_hyou:20200307122601p:plain

これで、被説明変数Minutes, 説明変数GendarとJobが用意できました。

ここからは、Michael J. Crawley の Statistics: An Introduction using R を参考にして分析をしてみようと思います。 

 P168 のFactorial Experiments のところが参考になります。

まずは、barplot関数で棒グラフを描いてみます。

f:id:cross_hyou:20200307123223p:plain

f:id:cross_hyou:20200307123300p:plain

男性・無業者が一番長く、次は女性・無業者、3番目が男性・有業者、一番短いのは女性・有業者だとわかります。barplot関数をはずして数値でもみてみます。

f:id:cross_hyou:20200307123552p:plain

女性・無業者は43分、男性・無業者は74分、女性・有業者は27分、男性・有業者は40分ほどです。

今回は以上です。