Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

毎月勤労統計調査の分析V2_7 - 規模別、性別、形態別の時給を計算してみる。

今回は、規模別、性別、形態別の時給を計算してみましょう。

まずはCSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。

f:id:cross_hyou:20180928135212j:plain

もう、面倒なので、このまま総労働時間と給与総額を使って時給を計算してしまいましょう。

f:id:cross_hyou:20180928135522j:plain

最低時給が816円です。。。これって最低賃金に抵触しないのかな。。最高時給は8946円です。平均は2661円、中央値は2468円です。

ヒストグラムを見てみましょう。hist関数です。

f:id:cross_hyou:20180928135753j:plain

f:id:cross_hyou:20180928135802j:plain

箱ひげ図も書いてみましょう。boxplot関数です。

f:id:cross_hyou:20180928135934j:plain

f:id:cross_hyou:20180928135945j:plain

では、規模別の時給の平均値を計算してみましょう。tapply関数とmean関数です。

f:id:cross_hyou:20180928140730j:plain

round関数で小数点以下を切り上げて、sort関数で小さい順に表示しました。

時給の一番低いのは規模が一番小さい5-29人で、時給の一番高いのは規模が一番大きい1000人以上です。棒グラフにしてみます。barplot関数です。

f:id:cross_hyou:20180928140923j:plain

f:id:cross_hyou:20180928140952j:plain

性別の時給を見てみましょう。tapply関数とmean関数です。

f:id:cross_hyou:20180928141422j:plain

男の時給が一番高く、女の時給が一番低く、男女合計がその間というわかりやすい結果ですね。棒グラフにしましょう。barplot関数です。

f:id:cross_hyou:20180928141636j:plain

f:id:cross_hyou:20180928141646j:plain

勤務形態別の時給を計算します。tapply関数とmean関数です。

f:id:cross_hyou:20180928142004j:plain

パートが低く、一般が高く、パートと一般の合計がその間というこれまたわかりやすい結果です。

棒グラフにしましょう。barplot関数です。

f:id:cross_hyou:20180928142324j:plain

f:id:cross_hyou:20180928142334j:plain

時給の高いのは規模は1000人以上の事業所、性別は男、勤務形態では一般です。

そこで、規模は1000人以上で性別は男、または規模は1000人以上で勤務形態は一般というデータフレームを作成して、その平均時給を計算してみましょう。

f:id:cross_hyou:20180928143001j:plain

平均時給は4353円です。

その反対に規模は5-29人で、性別は女、または規模は5-29人で勤務形態はパートというデータフレームを作成して平均時給を計算してみましょう。

f:id:cross_hyou:20180928143321j:plain

平均時給は1523円で高時給のグループの半分以下です。

この二つを棒グラフにして比較してみましょう。

f:id:cross_hyou:20180928143818j:plain

f:id:cross_hyou:20180928143835j:plain

ヒストグラムでも比較してみましょう。

f:id:cross_hyou:20180928144530j:plain

f:id:cross_hyou:20180928144539j:plain

par(mfrow=c(2,1))と始めにグラフエリアの配置を、2行1列と指定してから、hist関数を使うとこのように1つのグラフ画面の中に二つのヒストグラムを配置できます。