今回は毎月勤労統計の2018年7月のデータを使って、産業ごとの値を見たいと思います。前回の分析では集約された産業分類も個々の産業分類も一緒になっていたので、いまひとつ納得感のある分析ではありませんでした。
まずは、毎月勤労統計がどのように産業分類されているのか確認しましょう。
「毎月勤労統計調査における記号の見方」というPDFファイルを見たら、大分類、中分類、特掲産業という3つのくくりがありました。
大分類はこうなっています。
TLは調査産業計ですから、実際の大分類は、Cの鉱業、採石業、砂利採取業からRのサービス業(他に分類されないもの)の16種類です。今回はこの16種類の産業分類で調べてみましょう。
ついでに規模はどのようになっているかというと、このようになっています。
形態もついでですから見ておきましょう。
規模や性別、就業形態です。
今回は大分類の16産業分類の規模は5人以上、性別は男女計で絞り込んで人数や給与総額などを見てみましょう。
まずは、CSVファイルに保存してあるデータをread.csvファイルでR言語に読込みます。head関数とsummary関数でどんなデータセットなのか確認しましょう。
業種コード、規模、性別、形態の4つの列で条件を絞り込めばいいのですね。
まず、業種コードが、C,D,E,F,G,H,I,O,P,Q,Rだけのデータフレームを作成します。
data$業種コード=="C" | data$業種コード=="D" 。。。と条件を | でつなげるとOR検索になりますね。summary関数でみてみましょう。
業種コードのところが、C : 40 、D : 40 などとなっていますね。
規模は5人以上だけに絞りましょう。
規模のところを見ると5人以上は75で、その他は0になっていますね。
性別を男女合計だけにしましょう。
性別のところが男女合計は45で、女、男は0になりました。形態を合計だけにしましょう。
これで条件が絞り込まれましたので、大分類の16業種、規模は5人以上、性別は男女合計、形態は合計になtれいるはずです。全体を表示して確認しましょう。
最後の仕上げで、行番号(1列目)、業種コード(3列目)、規模(4列目)、性別(5列目)、形態(6列目)を削除してしまいましょう。
きれいになりましたが、一番左端、行番号が気に入らないです。これも直しましょう。
では、七月末人数の大きい順に並び替えてみましょう。
卸売小売が937万人で一番多く、製造業は808万人、宿泊飲食サービスは441万人と続きます。
barplot関数で棒グラフにしてみましょう。barplot関数です。
卸売小売と製造業がツートップという感じですね。
給与総額も並びかえましょう。
学術研究、専門・技術サービスが56万1677円でトップです。宿泊飲食サービスが13マン8864円で最下位です。
これも棒グラフにしましょう。
人数とは違った形ですね。こちらのそうが違いがあまりない感じです。
今回はここまでです。