の続きです。
今回は、Principal Component Analysisというのをやってみます。これは、explanatory variablesが多いときに数を減らすのに使うらしいです。
prcomp関数でできるそうです。
Food, Houseなどの変数からPC1、PC2などの変数を作りました。
str関数で構造を確認します。
上の表は、rotationという名前で格納されているようです。round関数で小数点以下3桁までで表示してみます。
PC1は、0.0168 x Food - 0.0007 x House + 0.049 x Wear + 0.9998 x perIncome + 0.0000 x logMitssudoということです。
PC1はperIncomeが一番大きい比率ですね。PC2はHouseが一番大きい比率(マイナス)ですが。PC2は1人当り課税所得が高いと、PC2は住居費が低いと値が大きくなります。
PC1とPC2を計算してみます。
plot関数とtext関数で散布図を描きます。
東京都は右下の隅っこにいます。1人当りの課税所得が大きく、住居費が大きいということですね。1人当りの課税所得は多いほうがいいでしょうし、住居費は少ないほうがいいでしょうから、このグラフでいうと、右上にいるほど、良い都道府県と言えるのかな?
今回は以上です。