前回までは製造業/非製造業を一つの切り口にしてクロス表を作成して分析しました。
今回は、規模と母集団数についての関係性を見てみたいと思います。
常識的な感覚からすると、規模が小さいグループほど母集団数は多いと思いますが、はたして本当でしょうか?
今回も2016年度の法人企業統計年報データで分析します。
規模についておさらいすると、
資本金 規模コード
10億円以上 >>>>>>>>>>>>>> KL1
1億円以上10億円未満 >>>>>> KL2
5千万円以上1億円未満 >>>>> KL3
2千万円以上5千万円未満 >>> KL4
1千万円以上2千万円未満 >>> KL4
というようにしています。
R言語のtable関数で、Kibo_Popu という変数名でクロス表を作成しました。
事前の予想どおり、KL1とう規模の大きいグループは、Popu_Sという母集団数が少ないグループに多いようになっています。
それでは、独立性の検定を summary関数でしてみましょう。
p-value = 1.194e-28 < 0.005 なので、独立性は棄却されました。
つまり、規模と母集団数は関係がある、ということです。
では、どの組み合わせが有意な組み合わせなのか、調整済み残差をみてみましょう。
chisq.testの結果を kekka という変数に格納し、kekka$stdres で表示します。
調整済み残差が±2以上の組み合わせが関係のある組み合わせです。
今回は、モザイクグラフも作成してみましょう。
library(graphics)でgraphicsを呼び出してから、mosaicplot関数を使います。
規模の大きいKL1は母集団数の少ないPopu_Sが多く、反対に規模の小さいKL5は母集団数の多いPopu_Lが多いことがよくわかります。