crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

毎月勤労統計調査の分析3 - データをヒストグラムで見える化する。(par関数, hist関数)

今回は、毎月勤労統計調査のデータをグラフにしてみたいと思います。

まずは、データをread.csv関数でR言語に読込み、head関数、summary関数を適用してみます。

f:id:cross_hyou:20180726185127j:plain

このファイルは、2018年5月のデータと2010年5月のデータが合わさっています。

2018年のデータ、2010年のデータと分けて読み込ませましょう。subset関数を使います。

f:id:cross_hyou:20180726185932j:plain

f:id:cross_hyou:20180726190036j:plain

給与総額のヒストグラムを作成してみましょう。

par(mfrow=c(2,1))としてから、hist関数を適用すると、1つの画面に二つのヒストグラムを並べることができます。

f:id:cross_hyou:20180726191802j:plain

f:id:cross_hyou:20180726191910j:plain

2018年のほうが給与総額の一番右の部分、4e+05~5e+05のところの度数が多いですね。2018年のほうが給与総額が多い感じですね。

給与と残業はどうでしょうか?

f:id:cross_hyou:20180726192801j:plain

f:id:cross_hyou:20180726192729j:plain

2018年は25万~30万のところが6件と集中していますね。

f:id:cross_hyou:20180726193041j:plain

f:id:cross_hyou:20180726193118j:plain

2018年は25万から30万が一番多いクラスですが、2010年は30万~35万が一番多いクラスです。

残業代はどうでしょうか?

f:id:cross_hyou:20180726193417j:plain

f:id:cross_hyou:20180726193450j:plain

残業代は2018年のほうが右に偏っている感じですね。

最後は、特別支給です。

f:id:cross_hyou:20180726193729j:plain

f:id:cross_hyou:20180726193806j:plain

特別支給は、2010年のほうが右に偏っている感じですね。