Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

法人企業統計の分析5 - データの標準化

f:id:cross_hyou:20180519121731j:plain

今回は、2016年度の法人企業統計年報のデータの標準化をしてみたいと思います。

今回のデータの標準化では、

(個々のデータ - データセットの平均値) / データセット標準偏差

で計算され、zスコアと呼ばれる値を計算します。受験のときに一喜一憂した偏差値も標準化の一つです。

 

総資本経常利益率売上高経常利益率総資本回転率の3つのデータを標準化して、どの業種・規模のグループが一番良かったのか調べてみます。

zスコアの合計値が大きかった業種+規模は以下のとおりです。

f:id:cross_hyou:20180526145957j:plain

職業紹介・労働者派遣業が高収益のようですね。そういえば、最近そういう会社のCMが目につきますね。儲かっているんですね。

 

その逆に、zスコアの合計値が低かった業種+規模は以下のとおりです。

f:id:cross_hyou:20180526150338j:plain

いろんな業種+規模がありますね。なんだか、規模の小さいところが多い感じです。