の続きです。
年度別のshotoku, small, largeを計算してみます。
R言語のgroup_by関数、select関数, summarise関数, mean関数, sd関数を使用しました。
group_by(year)でyear別にして、select(year, shotoku)でyearとshokotkuだけを抜き出しています。summarise関数の中でmean関数とsd関数を使って年別のshotokuの平均値と標準偏差を計算しました。
2009年度は平均255万7千円、2011年度は267万6千円、2014年度は277万4千円と上昇しています。
small, 従業者人数が1~4人の事業所の割合は、2009年度が61.1%, 2011年度が60.0%, 2014年度は59.7%と減少しています。
large, 従業者人数が300人以上の事業所の割合は、2009年度は15.7%, 2011年度は16.7%, 2014年度は16.7%でした。上昇しているのかな?
yearによる違いがあると言えるかどうか、R言語のlm関数とanova関数で確かめてみます。
P値は0.09659と0.05よりも大きいです。
つまり、yearによる違いはあるとは言えないです。
これに、都道府県による違いも考慮に入れたらどうでしょうか?
year, prefのp値がともに2.2e-16よりも小さくなりました。都道府県ごとに見たら、yearによってshotokuは違いがある、と言えます。
smallはどうでしょうか?
small, 従業者人数が1~4人の事業所の割合は、p値が0.01997と0.05以下なので、都道府県の違いを考慮しなくても年度によって違いがあることがわかります。
largeはどうでしょうか?
p値は0.6219と0.05よりも大きいです。largeの値はyearによる違いは無い、ということです。
shotokuのときと同じように、prefを考慮してみます。
prefを考慮に入れると、yearが有意になりました。
年度によって、所得や事業所の割合が変化していることが確認できました。
今回は以上です。