www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の空き家・持ち家・借家数のデータ分析3 - R言語で40年間の空き家率・持ち家率・借家率の変化を検定する。

 

www.crosshyou.info

の続きです。

今回は経年変化を見てみます。

まず、データの一番新しい年と一番古い年は何年か確認します。

f:id:cross_hyou:20201108165346p:plain

一番古い調査年は1978年、一番新しい調査年は2018年、40年間でどのように変化してるのでしょうか?

空き家率がどう変化したか、見てみます。

ggplot2パッケージのgeom_histogram関数とfacet_grid関数を使います。

f:id:cross_hyou:20201108165843p:plain

f:id:cross_hyou:20201108165956p:plain

上段のヒストグラムが1978年、下段が2018年です。

空き家率が上昇しているのが明らかです。

持ち家率はどうでしょうか?

f:id:cross_hyou:20201108170300p:plain

f:id:cross_hyou:20201108170316p:plain

持ち家率は1978年のほうが高かったようです。

借家率はどうでしょうか?

f:id:cross_hyou:20201108170642p:plain

f:id:cross_hyou:20201108170700p:plain

借家率は1978年は散らばっていたのが、2018年はまとまっている感じですね。

t.test関数で1978年と2018年で有意な違いがあるかどうかを検定します。

まずは、空き家率からです。

f:id:cross_hyou:20201108171402p:plain

上のようにして、1978年の空き家率のベクトルと2018年の空き家率のベクトルを作成しました。

この2つのベクトルをt.test関数で検定します。

f:id:cross_hyou:20201108171702p:plain

p-valueが2.2e-16よりも小さいということは1978年の空き家率と2018年の空き家率には有意な違いがあるということです。95%信頼区間が-0.089から-0.072と0以下です。

空き家率は40年間で有意に上昇したということですね。

 

持ち家率はどうでしょうか?同じようにt.test関数を使います。

f:id:cross_hyou:20201108172218p:plain

1978年と2018年の持ち家率のベクトルを作成します。arrange(pref)としていますので、都道府県の名前順にデータは並んでいます。

t.test関数で検定をします。

f:id:cross_hyou:20201108172514p:plain

p-valueが1.305e-09と0.05よりも小さいので有意です。95%信頼区間は、0.050から0.0870です。この40年間で持ち家率が有意に低下したということです。

 

借家率はどうでしょうか?

f:id:cross_hyou:20201108173041p:plain

まず1978年と2018年の借家率のベクトルを作成しました。

t.test関数で検定します。

f:id:cross_hyou:20201108173417p:plain

p-valueは0.002433と0.05よりも小さいので、1978年と2018年では借家率に有意な違いがあるということです。95%信頼区間が0.00857から0.0374なので、2018年の借家率のほうが低いということですね。

つまり、1978年から2018年の40年間で、

空き家率は上昇、持ち家率と借家率は下落したということです。

今回は以上です。