crosshyou

主にクロス表(分割表)分析をしようかなと思います。

毎月勤労統計調査の分析V2_2 - もっと多くのデータで基本統計量を算出

前回のデータ量が少なかったので、今回はもっと大きなデータで毎月勤労統計調査のデータを分析したいと思います。

こんな感じです。

f:id:cross_hyou:20180922174832j:plain

これがhead関数で始めの6行を表示したもの。

そして下図がsummary関数で要約統計量を表示したものです。

f:id:cross_hyou:20180922174949j:plain

行番号もMaxが4640です。つまりデータレコードが4640あるということです。

給与総額などでNAが360もあります。これは例えば、持ち帰り配達飲食サービスなどの業種で1000人以上の労働者がいる事業所が無い場合もあるからです。

前回は全産業トータルのデータだけでしたが、今回は細かい業種まで取込みましたので、例えば、給与総額の最小値は0円、最大値は163万0293円となっています。

給与総額0円は出勤日数0だとそうなっちゃうのかもしれないですね。

次回以降は、このデータでいろいろR言語の練習をしたいと思います。