今回は、規模別、性別、形態別の時給を計算してみましょう。
まずはCSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。
もう、面倒なので、このまま総労働時間と給与総額を使って時給を計算してしまいましょう。
最低時給が816円です。。。これって最低賃金に抵触しないのかな。。最高時給は8946円です。平均は2661円、中央値は2468円です。
ヒストグラムを見てみましょう。hist関数です。
箱ひげ図も書いてみましょう。boxplot関数です。
では、規模別の時給の平均値を計算してみましょう。tapply関数とmean関数です。
round関数で小数点以下を切り上げて、sort関数で小さい順に表示しました。
時給の一番低いのは規模が一番小さい5-29人で、時給の一番高いのは規模が一番大きい1000人以上です。棒グラフにしてみます。barplot関数です。
性別の時給を見てみましょう。tapply関数とmean関数です。
男の時給が一番高く、女の時給が一番低く、男女合計がその間というわかりやすい結果ですね。棒グラフにしましょう。barplot関数です。
勤務形態別の時給を計算します。tapply関数とmean関数です。
パートが低く、一般が高く、パートと一般の合計がその間というこれまたわかりやすい結果です。
棒グラフにしましょう。barplot関数です。
時給の高いのは規模は1000人以上の事業所、性別は男、勤務形態では一般です。
そこで、規模は1000人以上で性別は男、または規模は1000人以上で勤務形態は一般というデータフレームを作成して、その平均時給を計算してみましょう。
平均時給は4353円です。
その反対に規模は5-29人で、性別は女、または規模は5-29人で勤務形態はパートというデータフレームを作成して平均時給を計算してみましょう。
平均時給は1523円で高時給のグループの半分以下です。
この二つを棒グラフにして比較してみましょう。
ヒストグラムでも比較してみましょう。
par(mfrow=c(2,1))と始めにグラフエリアの配置を、2行1列と指定してから、hist関数を使うとこのように1つのグラフ画面の中に二つのヒストグラムを配置できます。