Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

毎月勤労統計調査の分析V2_5 - 時給換算で一番時給の良い業界は?

今回は前回作成した毎月勤労統計調査2018年7月データの大分類データで時給換算で一番時給の良い業界はどこなのか調べたいと思います。

まずは、前回の結果、産業分類大分類別の給与総額ランキングです。

f:id:cross_hyou:20180927100956j:plain

学術研究、専門・技術サービスが一番給与総額が高かったですね。

時給換算したらどうなるでしょうか?

総労働時間も一緒に表示してみましょう。

f:id:cross_hyou:20180927101357j:plain

データフレーム[ , c(”列名1", "列名2")]

のように表示したい列名を選択して表示することができます。

一番給与総額の低かった宿泊飲食サービスは、総労働時間も99.2時間で一番少ないです。

それでは、時給を計算してみましょう。

f:id:cross_hyou:20180927101958j:plain

こうなりました。

では、時給の高い順に並び替えて表示しましょう。

f:id:cross_hyou:20180927102351j:plain

こうなりました。時給でも学術研究、専門・技術サービスが一番高いです。時給3476円です。そして、宿泊飲食サービスが時給換算でも一番低く、1400円です。

宿泊飲食サービスは、パートの比率が高いからだと思うのですが、どうでしょうか?

パート比率を計算してみましょう。あ、その前にデータの全項目を見てみましょう。

summary関数です。

f:id:cross_hyou:20180927103020j:plain

"パート人数" という項目と"七月末人数"という項目でパート比率が計算できますね。

f:id:cross_hyou:20180927103401j:plain

やっぱり、宿泊飲食サービスのパート比率は77.64%ということで全産業分類の中で一番高いです。時給とパート比率の散布図を見てみましょう。plot関数です。

f:id:cross_hyou:20180927103810j:plain

f:id:cross_hyou:20180927103822j:plain

X軸が時給でY軸がパート比率の散布図です。パート比率が高いほど、時給が低いという逆相関ですね。cor関数で相関係数を計算しましょう。

f:id:cross_hyou:20180927104040j:plain

相関係数は、-0.832とかなりの逆相関です。

この相関係数が統計的に有意かどうか、検定します。cor.test関数です。

f:id:cross_hyou:20180927104359j:plain

p-value = 0.0001191 < 0.05 ですから、統計的に有意です。つまり、業界の時給はパート比率と関係があるということです。