www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

日銀の短観データの分析5 - R言語でANOVA。繊維や紙・パルプは景気が悪く、対事業所サービスや通信は景気がいい。

 

www.crosshyou.info

 の続きです。

今回の説明変数はIndus, 業種です。summary関数でどういう業種があるか見てみます。

f:id:cross_hyou:20191010154900j:plain

33種類の業種があります。今回は前回までとは違ったアプローチでANOVAをやってみたいと思います。

いつものように参考図書は、

 

Statistics: An Introduction Using R

Statistics: An Introduction Using R

 

 です。

aov関数でANOVAのモデルを作成し、summary.lm関数で表示します。

f:id:cross_hyou:20191010160106j:plain

f:id:cross_hyou:20191010160119j:plain

各業種のp値を見ると、電気・ガスが0.875278と一番大きいです。電気・ガスは、はん用機械と一緒にしても大丈夫そうです。

f:id:cross_hyou:20191010161152j:plain

p値が0.8753なのでmodel2でもいいですね。summary.lm関数で確認します。

f:id:cross_hyou:20191010161452j:plain

f:id:cross_hyou:20191010161508j:plain

非製造業が0.6878のp値で一番高いので、これを、はん用機械と統合してmodel3を作りましょう。

f:id:cross_hyou:20191010162138j:plain

p値が0.6878と0.05以上ですから、model2とmodel3に有意な違いはありません。なのでシンプルなほう、model3を採用します。model3を見てみましょう。

f:id:cross_hyou:20191010162644j:plain

f:id:cross_hyou:20191010162657j:plain

運輸・郵便のp値が一番大きいようです。これをはん用機械に統合してmodel4を作成します。

f:id:cross_hyou:20191010163219j:plain

p値が0.4799と0.05よりも大きいので、model3とmodel4に有意な違いはないです。なので、model4を採用してさらに統合できる業種は統合します。

f:id:cross_hyou:20191010163710j:plain

f:id:cross_hyou:20191010163734j:plain

化学のp値が一番大きいので化学をはん用機械に統合したmodel5を作成します。

f:id:cross_hyou:20191010164151j:plain

p値は0.3896と0.05より大きいので、model4とmodel5で有意な違いはあありません。従いまして、よりシンプルなmodel5を採用します。

f:id:cross_hyou:20191010164713j:plain

f:id:cross_hyou:20191010164727j:plain

業務用機械のp値が一番大きいので、これをはん用機械に統合します。

f:id:cross_hyou:20191010165147j:plain

p値は0.3351なのでmodel5とmodel6のふたつに有意な違いはありません。model6を調べます。

f:id:cross_hyou:20191010165508j:plain

f:id:cross_hyou:20191010165522j:plain

窯業・土石製品をはん用機械に統合します。

f:id:cross_hyou:20191010165914j:plain

p値が0.3665なので、model6とmodel7では有意な違いはありません。model7を採用します。

f:id:cross_hyou:20191010170217j:plain

f:id:cross_hyou:20191010170231j:plain

全産業をはん用機械に統合します。

f:id:cross_hyou:20191010170852j:plain

model8を採用します。

f:id:cross_hyou:20191010171107j:plain

f:id:cross_hyou:20191010171120j:plain

生産用機械をはん用機械に統合します。

f:id:cross_hyou:20191010171503j:plain

model9を採用します。

f:id:cross_hyou:20191010171852j:plain

f:id:cross_hyou:20191010171909j:plain

木材・木製品をはん用機械に統合します。

f:id:cross_hyou:20191010172215j:plain

model10を採用します。

f:id:cross_hyou:20191010172444j:plain

f:id:cross_hyou:20191010172501j:plain

卸売をはん用機械に統合します。

f:id:cross_hyou:20191010173041j:plain

model11を採用します。

f:id:cross_hyou:20191010173401j:plain

f:id:cross_hyou:20191010173415j:plain

とうとう、各業種が全部有意になりました。これでモデルの単純化は終わりです。

切片の値は8.6742です。これははん用機械と統合された業種の平均値が8.6742ということですね。物品賃貸は14.7424となっています。これは、8.6742 + 14.7424 = 23.416が物品賃貸の平均値ということですね。tapply関数でたしかめます。

f:id:cross_hyou:20191010173920j:plain

たしかにそうなっていますね。

最後にmodel11のグラフを描いておわります。

f:id:cross_hyou:20191010174232j:plain

f:id:cross_hyou:20191010174244j:plain