crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の1人当りの県民所得と従業者人数別事業所割合の分析3 - R言語でANOVA分析

 

www.crosshyou.info

 の続きです。

年度別のshotoku, small, largeを計算してみます。

R言語のgroup_by関数、select関数, summarise関数, mean関数, sd関数を使用しました。

 

group_by関数とsummarise関数

group_by(year)でyear別にして、select(year, shotoku)でyearとshokotkuだけを抜き出しています。summarise関数の中でmean関数とsd関数を使って年別のshotokuの平均値と標準偏差を計算しました。

2009年度は平均255万7千円、2011年度は267万6千円、2014年度は277万4千円と上昇しています。

group_by関数とsummarise関数

small, 従業者人数が1~4人の事業所の割合は、2009年度が61.1%, 2011年度が60.0%, 2014年度は59.7%と減少しています。

group_by関数とsummarise関数

large, 従業者人数が300人以上の事業所の割合は、2009年度は15.7%, 2011年度は16.7%, 2014年度は16.7%でした。上昇しているのかな?

 

yearによる違いがあると言えるかどうか、R言語のlm関数とanova関数で確かめてみます。

lm関数をanova関数

P値は0.09659と0.05よりも大きいです。

つまり、yearによる違いはあるとは言えないです。

これに、都道府県による違いも考慮に入れたらどうでしょうか?

lm関数とanova関数

year, prefのp値がともに2.2e-16よりも小さくなりました。都道府県ごとに見たら、yearによってshotokuは違いがある、と言えます。

smallはどうでしょうか?

lm関数とanova関数

small, 従業者人数が1~4人の事業所の割合は、p値が0.01997と0.05以下なので、都道府県の違いを考慮しなくても年度によって違いがあることがわかります。

 

largeはどうでしょうか?

lm関数とanova関数

p値は0.6219と0.05よりも大きいです。largeの値はyearによる違いは無い、ということです。

shotokuのときと同じように、prefを考慮してみます。

lm関数とanova関数

prefを考慮に入れると、yearが有意になりました。

年度によって、所得や事業所の割合が変化していることが確認できました。

今回は以上です。