Photo by Nat Fernández on Unsplash
の続きです。
前回作成した、df_mardivのデータフレームのサマリーを見てみます。
pop: 人口とsch: 中学校数もすべての年でデータがそろっていますね。
とりあえず、これらNAの無い変数だけのデータフレームを作ります。
これをパネルデータにします。
plmパッケージを読み込み、pdata.frame関数を使います。
まず、yearを文字列型から数値型になおして、pdata.frame()関数でパネルデータフレームにしました。pdim()関数で表示させると、n = 47, T = 45のバランスパネルデータだとわかります。
小手調べということで、div_marをその他の変数で回帰分析してみます。
係数がe-08などとなっていてよくわからないので、
div_marを100倍してパーセント表示にします。
popを10000で割って1万人単位にします。
marを10000で割って1万件単位にします。
divを10000で割って1万件単位にします。
schを10000で割って1万校単位にします。
そして、options(scipen = 2)などとしてe-08などが出ないようにします。
人口が1万人増えると、div_mar: 離婚レシオは0.019%低下します。
婚姻が1万件増えると、離婚レシオは7.4%低下します。
離婚が1万件増えると、離婚レシオはは25.5%上昇します。
中学校数が1万校増えると、離婚レシオは527%低下します。
ということですが、なんかおかしいというか変ですよね。
pop, mar, div, schの相関関係を見てみます。
pop, mar, div, schはどれもかなりの高相関です。
popだけにしてみます。
人口が1万人増えると、離婚レシオは0.07パーセントポイント上昇します。
plm1のモデルの係数とは符号が逆になりました。
年のトレンドを加えてみます。
年のトレンドを加えると、popの係数は有意ではなくなりました。
1975年から始まっているので、1974を引いて、1975年=1にしています。
1年たつごとに、離婚レシオは0.37パーセントポイント増えていきます。
今回は以上です。
初めから読むには、
です。