www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の第1次産業・第2次産業・第3次産業事業所数のデータ分析2 - R言語でヒストグラムや箱ひげ図を描く

 

www.crosshyou.infoの続きです。

今回は、前回作成した、人口当りの県内総生産額(perGDP), 第1じ産業事業所数(per1st), 第2次産業事業所数(per2nd), 第3次産業事業所数(per3rd)の分布の様子をヒストグラムや箱ひげ図にしてみたいと思います。

f:id:cross_hyou:20200501190700j:plain

 最初にfunction関数で、ヒストグラム、箱ひげ図、小さい順のチャートを一度に描く関数を定義しました。この関数でperGDPを見てみます。

f:id:cross_hyou:20200501190803j:plain

上に外れ値がある分布です。ヒストグラムは右の裾野が広いかたちです。

 

次は、per1stです。

f:id:cross_hyou:20200501190950j:plain

f:id:cross_hyou:20200501191002j:plain

per1stも上に外れ値がありますね。perGDPほどではないですが、右の裾野が広いヒストグラムです。

 

per2ndを見てみます。

f:id:cross_hyou:20200501191140j:plain

f:id:cross_hyou:20200501191150j:plain

これも上に外れ値があります。右の裾野が広いヒストグラムですが、perGDP, per1stほどではありません。

 

最後は、per3rdです。

f:id:cross_hyou:20200501191345j:plain

f:id:cross_hyou:20200501191357j:plain

お、これは下に外れ値があって、いままでの3つとは違い、左の裾野が広いヒストグラムですね。

 

こうして、各変数のヒストグラムの裾野が右側が広いとか左側が広いとかをSkewいいます。

 

Statistics: An Introduction Using R

Statistics: An Introduction Using R

 

 この本を参考にして、Skewを計算してみましょう。

f:id:cross_hyou:20200501210949j:plain

 この関数を使って、各変数のSkewを計算します。

f:id:cross_hyou:20200501211114j:plain

Skewは0だと左右対称、プラスだと右側の裾野が広く、マイナスだと左側の裾野が広いヒストグラムになります。

この2.869936 が有意に0と違うかを検定します。

f:id:cross_hyou:20200501212324j:plain

まず、上のようにして、Skewが0と有意に違うかどうかを検定する関数をつくりました。

この関数を実行します。

f:id:cross_hyou:20200501212455j:plain

p-valueが0.05よりも小さいですから、perGDPのSkewは0ではないですね。

per1stはどうでしょうか?

f:id:cross_hyou:20200501212654j:plain

per1stのSkewは0.80です。perGDPよりも小さいですね。p-valueは0.001と0.05よりも小さいですから、per1stのSkewも0ではないです。

 

per2ndはどうでしょうか?

f:id:cross_hyou:20200501212859j:plain

per2ndのSkewは0.546とさらに0に近づきました。p-valueは0.017と0.05よりも小さいのでper2ndのSkewも0ではないです。

 

per3rdはどうでしょうか?

f:id:cross_hyou:20200501213118j:plain

per3rdのSkewはマイナスの1.07です。ヒストグラムの左側の裾野が広いことを表しています。p-valueがおかしいですね。関数式が間違っていましたね。訂正します。

f:id:cross_hyou:20200501213402j:plain

testのところにabs関数を入れて、プラスの値になるようにしました。

もういちど、per3rdを処理してみます。

f:id:cross_hyou:20200501213556j:plain

はい。こんどはうまくp-valueがでました。

一応、skew.test関数が正しく動いているかrnorm関数で正規分布になるような数列を作って確認しましょう。

f:id:cross_hyou:20200501213902j:plain

p-valueが0.32と0.05よりも大きいですから、Skewは0と有意な差はないです。

ヒストグラムで分布の形状をみます。

f:id:cross_hyou:20200501214103j:plain

f:id:cross_hyou:20200501214115j:plain

左右対称の正規分布ですね。

今回は以上です。