www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

法人企業統計の分析10 - 規模と母集団数

f:id:cross_hyou:20180519121731j:plain

前回までは製造業/非製造業を一つの切り口にしてクロス表を作成して分析しました。
今回は、規模と母集団数についての関係性を見てみたいと思います。

常識的な感覚からすると、規模が小さいグループほど母集団数は多いと思いますが、はたして本当でしょうか?

今回も2016年度の法人企業統計年報データで分析します。

規模についておさらいすると、

資本金                                    規模コード

10億円以上 >>>>>>>>>>>>>> KL1
1億円以上10億円未満 >>>>>> KL2

5千万円以上1億円未満 >>>>> KL3

2千万円以上5千万円未満 >>> KL4

1千万円以上2千万円未満 >>> KL4

というようにしています。

R言語のtable関数で、Kibo_Popu という変数名でクロス表を作成しました。

f:id:cross_hyou:20180531191145j:plain

事前の予想どおり、KL1とう規模の大きいグループは、Popu_Sという母集団数が少ないグループに多いようになっています。

それでは、独立性の検定を summary関数でしてみましょう。

f:id:cross_hyou:20180531191452j:plain

p-value = 1.194e-28 < 0.005 なので、独立性は棄却されました。

つまり、規模と母集団数は関係がある、ということです。

では、どの組み合わせが有意な組み合わせなのか、調整済み残差をみてみましょう。

chisq.testの結果を kekka という変数に格納し、kekka$stdres で表示します。

f:id:cross_hyou:20180531191940j:plain

調整済み残差が±2以上の組み合わせが関係のある組み合わせです。

今回は、モザイクグラフも作成してみましょう。

library(graphics)でgraphicsを呼び出してから、mosaicplot関数を使います。

f:id:cross_hyou:20180531192522j:plain

規模の大きいKL1は母集団数の少ないPopu_Sが多く、反対に規模の小さいKL5は母集団数の多いPopu_Lが多いことがよくわかります。