www.crosshyou.infoの続きです。
今回は、前回作成した、人口当りの県内総生産額(perGDP), 第1じ産業事業所数(per1st), 第2次産業事業所数(per2nd), 第3次産業事業所数(per3rd)の分布の様子をヒストグラムや箱ひげ図にしてみたいと思います。
最初にfunction関数で、ヒストグラム、箱ひげ図、小さい順のチャートを一度に描く関数を定義しました。この関数でperGDPを見てみます。
上に外れ値がある分布です。ヒストグラムは右の裾野が広いかたちです。
次は、per1stです。
per1stも上に外れ値がありますね。perGDPほどではないですが、右の裾野が広いヒストグラムです。
per2ndを見てみます。
これも上に外れ値があります。右の裾野が広いヒストグラムですが、perGDP, per1stほどではありません。
最後は、per3rdです。
お、これは下に外れ値があって、いままでの3つとは違い、左の裾野が広いヒストグラムですね。
こうして、各変数のヒストグラムの裾野が右側が広いとか左側が広いとかをSkewいいます。
この本を参考にして、Skewを計算してみましょう。
この関数を使って、各変数のSkewを計算します。
Skewは0だと左右対称、プラスだと右側の裾野が広く、マイナスだと左側の裾野が広いヒストグラムになります。
この2.869936 が有意に0と違うかを検定します。
まず、上のようにして、Skewが0と有意に違うかどうかを検定する関数をつくりました。
この関数を実行します。
p-valueが0.05よりも小さいですから、perGDPのSkewは0ではないですね。
per1stはどうでしょうか?
per1stのSkewは0.80です。perGDPよりも小さいですね。p-valueは0.001と0.05よりも小さいですから、per1stのSkewも0ではないです。
per2ndはどうでしょうか?
per2ndのSkewは0.546とさらに0に近づきました。p-valueは0.017と0.05よりも小さいのでper2ndのSkewも0ではないです。
per3rdはどうでしょうか?
per3rdのSkewはマイナスの1.07です。ヒストグラムの左側の裾野が広いことを表しています。p-valueがおかしいですね。関数式が間違っていましたね。訂正します。
testのところにabs関数を入れて、プラスの値になるようにしました。
もういちど、per3rdを処理してみます。
はい。こんどはうまくp-valueがでました。
一応、skew.test関数が正しく動いているかrnorm関数で正規分布になるような数列を作って確認しましょう。
p-valueが0.32と0.05よりも大きいですから、Skewは0と有意な差はないです。
ヒストグラムで分布の形状をみます。
左右対称の正規分布ですね。
今回は以上です。