www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の婚姻件数と離婚件数のデータの分析６ - options(scipen = xxxx)で数値の表示を変更できる。

データ分析

f:id:cross_hyou:20211017082605j:plain

Photo by Nat Fernández on Unsplash

www.crosshyou.info

の続きです。

前回作成した、df_mardivのデータフレームのサマリーを見てみます。

f:id:cross_hyou:20211017083004p:plain

pop: 人口とsch: 中学校数もすべての年でデータがそろっていますね。

とりあえず、これらNAの無い変数だけのデータフレームを作ります。

f:id:cross_hyou:20211017083511p:plain

これをパネルデータにします。

plmパッケージを読み込み、pdata.frame関数を使います。

f:id:cross_hyou:20211017083907p:plain

まず、yearを文字列型から数値型になおして、pdata.frame()関数でパネルデータフレームにしました。pdim()関数で表示させると、n = 47, T = 45のバランスパネルデータだとわかります。

小手調べということで、div_marをその他の変数で回帰分析してみます。

f:id:cross_hyou:20211017084627p:plain

係数がe-08などとなっていてよくわからないので、

div_marを100倍してパーセント表示にします。

popを10000で割って1万人単位にします。

marを10000で割って1万件単位にします。

divを10000で割って1万件単位にします。

schを10000で割って1万校単位にします。

そして、options(scipen = 2)などとしてe-08などが出ないようにします。

f:id:cross_hyou:20211017090108p:plain

人口が1万人増えると、div_mar: 離婚レシオは0.019%低下します。

婚姻が1万件増えると、離婚レシオは7.4%低下します。

離婚が1万件増えると、離婚レシオはは25.5%上昇します。

中学校数が1万校増えると、離婚レシオは527%低下します。

ということですが、なんかおかしいというか変ですよね。

pop, mar, div, schの相関関係を見てみます。

f:id:cross_hyou:20211017091149p:plain

pop, mar, div, schはどれもかなりの高相関です。

popだけにしてみます。

f:id:cross_hyou:20211017091440p:plain

人口が1万人増えると、離婚レシオは0.07パーセントポイント上昇します。

plm1のモデルの係数とは符号が逆になりました。

年のトレンドを加えてみます。

f:id:cross_hyou:20211017092241p:plain

年のトレンドを加えると、popの係数は有意ではなくなりました。

1975年から始まっているので、1974を引いて、1975年=1にしています。

1年たつごとに、離婚レシオは0.37パーセントポイント増えていきます。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。