今回は、毎月勤労統計調査のデータをグラフにしてみたいと思います。
まずは、データをread.csv関数でR言語に読込み、head関数、summary関数を適用してみます。
このファイルは、2018年5月のデータと2010年5月のデータが合わさっています。
2018年のデータ、2010年のデータと分けて読み込ませましょう。subset関数を使います。
給与総額のヒストグラムを作成してみましょう。
par(mfrow=c(2,1))としてから、hist関数を適用すると、1つの画面に二つのヒストグラムを並べることができます。
2018年のほうが給与総額の一番右の部分、4e+05~5e+05のところの度数が多いですね。2018年のほうが給与総額が多い感じですね。
給与と残業はどうでしょうか?
2018年は25万~30万のところが6件と集中していますね。
2018年は25万から30万が一番多いクラスですが、2010年は30万~35万が一番多いクラスです。
残業代はどうでしょうか?
残業代は2018年のほうが右に偏っている感じですね。
最後は、特別支給です。
特別支給は、2010年のほうが右に偏っている感じですね。