Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の個人企業経済調査のデータの分析2 - R言語のsummary関数、mean関数、var関数、sd関数などで基本統計量を調べる。

 

www.crosshyou.info

 の続きです。

今回はsales: 1企業当りの売上高【千円】について調べてみましょう。

まずは、summary関数で平均値や中央値を確認しましょう。

f:id:cross_hyou:20210313195409p:plain

最小値は239万6千円、最大値が3245万9千円、中央値が1100万4千円、平均値が1239万9千円です。

分散、標準偏差、変動係数も求めます。

f:id:cross_hyou:20210313195723p:plain

分散は383億1849万3千円^2 分散は千円^2という単位なのでピンとこないですね。

標準偏差は619万円ぐらいです。

変動係数は0.5ぐらいです。

上記で求めた平均値などは、indu: 産業がtotalという全体も混ざっていますので、totalとその他、というように別々にしたほうがいいです。

totalだけの平均値などを求めてみます。

f:id:cross_hyou:20210313200236p:plain

totalだけだと最小値は992万2千円、最大値は1608万2千円、中央値は1301万7千円、平均値は1289万6千円です。

標準偏差と変動係数も求めてみます。

f:id:cross_hyou:20210313200705p:plain

標準偏差は164万2千円、変動係数はは0.127です。

indusがtotal以外の平均値などを求めてみましょう。

f:id:cross_hyou:20210313201035p:plain

最小値は239万6千円、最大値は3245万9千円、中央値は1041万2千円、平均値は1231万7千円です。

標準偏差と変動係数も求めます。

f:id:cross_hyou:20210313201412p:plain

標準偏差は665万円ぐらい、変動係数は0.54ぐらいです。

totalだけのsalesよりもデータのバラツキが大きいということですね。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。