の続きです。
今回は、R言語で人口1人当りの県内総生産数(perGDP), 人口10万人当りの第1次産業事業所数(per1st), 人口10万人当りの第2次産業事業所数(per2nd), 人口10万人当りの第3次事業所数(per3rd)で、2009年度と2014年度で平均値に違いがあるかどうかを検定します。
まず、年度の確認をします。
年度は、2009年度と2014年度の2つです。この2つの年度でそれぞれの変数の平均値に違いがあるかどうかを調べます。
Yearをas.factor関数でファクター型に変換します。
2009年度を表すインデックスと2014年度を表すインデックスを用意しておきます。
都道府県の順番が、2009年度と2014年度で同じかどうか確認しておきます。
47となっていますから、同じです。
perGDPの分散が2009年度と2014年度で有意な差があるかを検定します。var.test関数です。
tapply関数とvar関数で2009年度のperGDPの分散は、0.5550975と、2014年度は0.5953861とわかりました。var.test関数の結果は、p-value = 0.8132と0.05よりも大きいので分散は同じと考えてよさそうです。
分散が同じならば、t.test関数で平均値に有意な違いがあるかどうか検定できます。対応のある検定になります。
2009年度のperGDPは3.534365が平均で、2014年度は3.748718が平均です。t.test関数の結果はp-value = 3.223e-11と0.05よりも小さいので、平均値に違いがあるということです。2014年度の1人当り県内総生産額は374万円が平均で2009年度は353万円と20万円ぐらい増えていますがこの違いは偶然ではなく、有意な違いと考えられます。
同じように、per1stも調べます。
per1stも分散に違いがあるとは言えないです。
第1次産業の事業所数は、2009年度は人口10万人当り3.81事業所で、2014年度は3.94事業所でした。この違いは、p-valueが0.002266と0.05よりも小さいですから、有意な違いと言えます。
per2ndはどうでしょうか?
per2ndも分散に違いがあるとは言えないです。平均値を比較します。
第2次産業事業所数は、人口10万人当りで、2009年度は92.74で2014年度は85.34です。これはp-valueが2.2e-16より小さいですから有意な違いです。県内総生産額、第1次産業事業所数は2014年度のほうが増えていましたが、第2次産業事業所数は減少しているのですね。
per3rdを見てみます。
per3rdも分散に違いがあるとは言えないです。
平均値に違いがあるかどうかをt.test関数で検定します。
p-value < 2.2e-16と0.05よりも大きいので、平均値に有意な違いがあります。
人口10万人当りの第3次産業事業所数は、2009年度は398.8で、2014年度は383です。第3次産業事業所数も減少しています。
2009年度と2014年度を比較すると、
人口当りの県内総生産額と第1次産業事業所数は増加、第2次産業事業所数と第3次産業事業所数は減少とわかりました。
今回は以上です。