の続きです。
今回は経年変化を見てみます。
まず、データの一番新しい年と一番古い年は何年か確認します。
一番古い調査年は1978年、一番新しい調査年は2018年、40年間でどのように変化してるのでしょうか?
空き家率がどう変化したか、見てみます。
ggplot2パッケージのgeom_histogram関数とfacet_grid関数を使います。
上段のヒストグラムが1978年、下段が2018年です。
空き家率が上昇しているのが明らかです。
持ち家率はどうでしょうか?
持ち家率は1978年のほうが高かったようです。
借家率はどうでしょうか?
借家率は1978年は散らばっていたのが、2018年はまとまっている感じですね。
t.test関数で1978年と2018年で有意な違いがあるかどうかを検定します。
まずは、空き家率からです。
上のようにして、1978年の空き家率のベクトルと2018年の空き家率のベクトルを作成しました。
この2つのベクトルをt.test関数で検定します。
p-valueが2.2e-16よりも小さいということは1978年の空き家率と2018年の空き家率には有意な違いがあるということです。95%信頼区間が-0.089から-0.072と0以下です。
空き家率は40年間で有意に上昇したということですね。
持ち家率はどうでしょうか?同じようにt.test関数を使います。
1978年と2018年の持ち家率のベクトルを作成します。arrange(pref)としていますので、都道府県の名前順にデータは並んでいます。
t.test関数で検定をします。
p-valueが1.305e-09と0.05よりも小さいので有意です。95%信頼区間は、0.050から0.0870です。この40年間で持ち家率が有意に低下したということです。
借家率はどうでしょうか?
まず1978年と2018年の借家率のベクトルを作成しました。
t.test関数で検定します。
p-valueは0.002433と0.05よりも小さいので、1978年と2018年では借家率に有意な違いがあるということです。95%信頼区間が0.00857から0.0374なので、2018年の借家率のほうが低いということですね。
つまり、1978年から2018年の40年間で、
空き家率は上昇、持ち家率と借家率は下落したということです。
今回は以上です。