Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の老人福祉費と児童福祉費の分析8 - R言語で一人当り児童福祉費を重回帰分析。東京都を含めるか除外するかでモデルが違ってくる。

 

www.crosshyou.info

 の続きです。

今回は一人当りの児童福祉費(ChildpM)を重回帰分析します。

説明変数は対数をとった面積(logArea)と対数をとった県内総生産(logGDP)です。

まずは、一番複雑なモデルから。

f:id:cross_hyou:20191017191555j:plain

logArea:logGDPの交差項は不要のようです。削除します。

f:id:cross_hyou:20191017191759j:plain

p値は0.9481です。model1もmodel2も有意な違いは無いです。より単純なmodel2を調べます。

f:id:cross_hyou:20191017192007j:plain

I(logArea^2)は不要ですね。削除します。

f:id:cross_hyou:20191017192206j:plain

model2とmodel3では有意な違いはありません。model3をさらに調べます。

f:id:cross_hyou:20191017192335j:plain

logAreaは不要ですね。削除します。前回の一人当り老人福祉費ではlogAreaは有意な変数でしたが、一人当りの児童福祉費では都道府県の面積は関係無いことがわかりました。

f:id:cross_hyou:20191017192721j:plain

p値が0.9822です、model3とmodel4で有意な差はありません。

model4をみてみましょう。

f:id:cross_hyou:20191017192941j:plain

これで、切片、logGDP、I(logGDP^2)の3つとも有意なモデルです。

logGDPをいろいろな値にして予測値を算出してみます。

f:id:cross_hyou:20191017193718j:plain

f:id:cross_hyou:20191017193732j:plain

こうなりました。散布図の一番右端の点、東京都ですがこれが影響して回帰曲線が放物線状になっていますね。東京都を除外すれば、単純に直線になるのではないでしょうか?やってみましょう。

f:id:cross_hyou:20191017194306j:plain

まずは、上のようにして東京都を除外したベクトルを作成しました。

後は同じ手順です。まずは一番複雑なモデルからやりましょう。

f:id:cross_hyou:20191017194545j:plain

exTArea:exTGDPはいらないです。削除します。

f:id:cross_hyou:20191017194743j:plain

exTm2を採用します。

f:id:cross_hyou:20191017194859j:plain

I(exTArea^2)は不要ですね。

f:id:cross_hyou:20191017195050j:plain

exTm3を採用します。

f:id:cross_hyou:20191017195215j:plain

exTAreaは必要ないようです。

f:id:cross_hyou:20191017195355j:plain

exTm4を採用します。

f:id:cross_hyou:20191017195522j:plain

これで、切片、exTGDP、I(exTGDP^2)の3つが有意になりました。2乗項も残りましたね。散布図と回帰曲線を描きましょう。

f:id:cross_hyou:20191017200011j:plain

f:id:cross_hyou:20191017200022j:plain

最後に東京都有りの散布図と回帰曲線、東京都無しの散布図と回帰曲線を並べて描いてみます。

f:id:cross_hyou:20191017200501j:plain

f:id:cross_hyou:20191017200512j:plain

東京都を入れないほうが回帰曲線のあてはまりがいいようです。

実際に東京都有りのmodel4のAdjusted R-squaredは0.5681

東京都無しのexTm4のAdjusted R-squaredは0.6873と東京都無しのほうが高いです。

今回は以上です。