www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の事業所数(民営)のデータ分析3 - R言語のaov関数でANOVA分析をする。

 

www.crosshyou.info

 の続きです。

今回は、Yearが4年分ありますので、これをファクターにみたててANOVA分析をしようと思います。aov関数でANOVA分析をします。

まずは、Mitsuです。

f:id:cross_hyou:20200514104241j:plain

Pr(<F)の値が1です。p値が1ということです。MitsuはYearによっては全く違いは無いということです。

f:id:cross_hyou:20200514104252j:plain

perInceはp値は0.159です。0.05よりも大きいですので、perIncもYearによって違いがあるとは言えません。

f:id:cross_hyou:20200514104305j:plain

perSはp値は0.00102と0.005よりも小さいです。YearによってperSは違いがあると言えます。

f:id:cross_hyou:20200514104327j:plain

perLはp値は0.977です。Yearによって違いがあるとは言えないですね。

 

perSはYearによって違いがあるようです。Yearごとの平均値を見てみましょう。

aovでANOVA分析のオブジェクトを作っていますので、summary.lm関数でわかります。

f:id:cross_hyou:20200514114513j:plain

Interceptの293.672が2009年のperSの平均値です。2011年のperSの平均値は、293.672-24.439=269.233です。2014年のperSの平均値は、293.672-19.943=273.729です。2016年のperSの平均値は、293.672-31.204=262.468です。傾向としてはperSは減少傾向ですね。

plot関数でYearごとの箱ひげ図を描きます。

f:id:cross_hyou:20200514142745j:plain

f:id:cross_hyou:20200514142822j:plain

こうしてみると、2009年は他とは明らかに水準が違うようです、2011年、2014年、2016年は同じくらいですね。

summary.lm関数のStd. Errorは8ぐらいですから、8の2倍、16ぐらいは差がないと有意に違ってるとは言えないですもんね。

ちょっと確認します。

f:id:cross_hyou:20200514143420j:plain

testYearという名前で2009、2012.5, 2016の3つのレベルを持つファクタを作りました。

これでaov関数でやってみます。

f:id:cross_hyou:20200514143658j:plain

p値は0.0003454ですからtestYearによってperSの平均値は違いがあります。

2012.5と2016を統合してみましょう。

f:id:cross_hyou:20200514144034j:plain

これでまたANOVAをしてみます。

f:id:cross_hyou:20200514144210j:plain

p値は0.0001569ですから有意です。2009年とその他の年度ではperSが違うということですね。

t.testでも確認できます。

f:id:cross_hyou:20200514144541j:plain

mean of X が2009年度のperSの平均値で、293.6716です。これはsummary.lm関数のInterceptの値と一致しています。そして、mean of yの268.4672が2009年以外の年度のperSの平均値ですね。

今回は以上です。