Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

毎月勤労統計調査の分析V2_4 - 大分類の業種での人数や給与総額を見てみる。(R言語でデータ整理)

今回は毎月勤労統計の2018年7月のデータを使って、産業ごとの値を見たいと思います。前回の分析では集約された産業分類も個々の産業分類も一緒になっていたので、いまひとつ納得感のある分析ではありませんでした。

まずは、毎月勤労統計がどのように産業分類されているのか確認しましょう。

「毎月勤労統計調査における記号の見方」というPDFファイルを見たら、大分類、中分類、特掲産業という3つのくくりがありました。

大分類はこうなっています。

f:id:cross_hyou:20180926150529j:plain

TLは調査産業計ですから、実際の大分類は、Cの鉱業、採石業、砂利採取業からRのサービス業(他に分類されないもの)の16種類です。今回はこの16種類の産業分類で調べてみましょう。

ついでに規模はどのようになっているかというと、このようになっています。

f:id:cross_hyou:20180926150814j:plain

形態もついでですから見ておきましょう。

f:id:cross_hyou:20180926150913j:plain

規模や性別、就業形態です。

今回は大分類の16産業分類の規模は5人以上、性別は男女計で絞り込んで人数や給与総額などを見てみましょう。

まずは、CSVファイルに保存してあるデータをread.csvファイルでR言語に読込みます。head関数とsummary関数でどんなデータセットなのか確認しましょう。

f:id:cross_hyou:20180926151727j:plain

f:id:cross_hyou:20180926151803j:plain

業種コード、規模、性別、形態の4つの列で条件を絞り込めばいいのですね。

まず、業種コードが、C,D,E,F,G,H,I,O,P,Q,Rだけのデータフレームを作成します。

f:id:cross_hyou:20180926153355j:plain

data$業種コード=="C" | data$業種コード=="D" 。。。と条件を | でつなげるとOR検索になりますね。summary関数でみてみましょう。

f:id:cross_hyou:20180926153641j:plain

業種コードのところが、C : 40 、D : 40 などとなっていますね。

規模は5人以上だけに絞りましょう。

f:id:cross_hyou:20180926153920j:plain

規模のところを見ると5人以上は75で、その他は0になっていますね。

性別を男女合計だけにしましょう。

f:id:cross_hyou:20180926154120j:plain

性別のところが男女合計は45で、女、男は0になりました。形態を合計だけにしましょう。

f:id:cross_hyou:20180926154501j:plain

これで条件が絞り込まれましたので、大分類の16業種、規模は5人以上、性別は男女合計、形態は合計になtれいるはずです。全体を表示して確認しましょう。

f:id:cross_hyou:20180926154718j:plain

最後の仕上げで、行番号(1列目)、業種コード(3列目)、規模(4列目)、性別(5列目)、形態(6列目)を削除してしまいましょう。

f:id:cross_hyou:20180926155212j:plain

きれいになりましたが、一番左端、行番号が気に入らないです。これも直しましょう。

f:id:cross_hyou:20180926155502j:plain

では、七月末人数の大きい順に並び替えてみましょう。

f:id:cross_hyou:20180926160011j:plain

卸売小売が937万人で一番多く、製造業は808万人、宿泊飲食サービスは441万人と続きます。

barplot関数で棒グラフにしてみましょう。barplot関数です。

f:id:cross_hyou:20180926160303j:plain

f:id:cross_hyou:20180926160317j:plain

卸売小売と製造業がツートップという感じですね。

給与総額も並びかえましょう。

f:id:cross_hyou:20180926160658j:plain

学術研究、専門・技術サービスが56万1677円でトップです。宿泊飲食サービスが13マン8864円で最下位です。

これも棒グラフにしましょう。

f:id:cross_hyou:20180926161016j:plain

f:id:cross_hyou:20180926161030j:plain

人数とは違った形ですね。こちらのそうが違いがあまりない感じです。

今回はここまでです。