Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気ウォッチャー調査分析4 - 分野別DIのデータは正規分布しているか?

今回は、景気ウォッチャー調査の分野別DI(方向性)のデータが、正規分布といえるかどうかを調べてみたいと思います。

データが正規分布にしたがうかどうかは、K-S検定(Kolmogorov-Suminov, コルモゴロフ・スミノフ)です。

R言語でデータを読み込み、ks.test関数で正規分布に従うかどうかを判定します。

まずは、read.csv関数でデータを読み込みます。

f:id:cross_hyou:20180612122252j:plain

summary関数でそれぞれの分野の基本統計量を表示しました。

前回の分析(ヒストグラム表示)では、どのデータも左の裾が広がっていました。これらの分布が正規分布しているといえるでしょうか?

帰無仮説:DIデータは正規分布している。

対立仮設:DIデータは正規分布していない。

です。

ks.test関数でみてみます。

f:id:cross_hyou:20180612122905j:plain

p-value = 0.002232 < 0.05 なので帰無仮説を棄却します。合計のDIは正規分布しているとは言えません。

同じ要領で残りの9のDIを検定しました。p-valueだけ抜き出しますと、

家計:p-value = 2.887e-15 < 0.05

小売:p-value = 0.02986 < 0.05

飲食:p-value = 0.009833 < 0.05

サービス:p-value = 0.001284 < 0.05

住宅:p-value = 0.005527 < 0.05

企業:p-valur = 0.003891 < 0.05

製造業:p-value = 0.002957 < 0.05

非製造業:p-value = 0.01373 < 0.05

雇用:p-value = 3.722e-05 < 0.05

となりました。10のDI全てで正規分布になっているとは言えません。