Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の共働き世帯割合のデータの分析6 - R言語のcarパッケージのlinearHypothesis()関数で回帰分析のF検定

f:id:cross_hyou:20211218075737j:plain

Photo by Kyle on Unsplash 

www.crosshyou.info

の続きです。

今回は、carパッケージのlinearHypothesis()関数というものを知ったので、忘れないように使ってみたいと思います。

前回は、tomo: 共働き世帯割合(%)を被説明変数にして、2期間のパネルデータでFirst Differentialの推定をしました。そうしたら、unem: 完全失業率(%)などの有意性がなくなりました。

今回は、tomoとlog(unem)を入れ替えて回帰分析をしてみます。

f:id:cross_hyou:20211218080649p:plain

tomoの係数は、-2.927e-02, つまり-0.02972です。そしてt値は-5.661, p値は2.03e-07と有意な変数といます。tomoが1ポイント上昇すると、unemが-0.02972%低下する、という解釈ができます。

さて、F検定をcarパッケージのlinearHypothesis()関数でやってみます。F検定は、複数の説明変数が有意なのかどうかを調べる検定です。

上の結果を見ると、consn: 人口集中地区の人口密度(人/km2)はt値が0.086で単独では有意ではないです。同じように、ggdp23: 県内総生産額対前年増加率(%, 平成23年基準)とr2: 第2次産業就業者比率(%)も単独では有意ではないです。

そこで、consn, ggdp23, r2の3つを1つとして考えたときに有意なのかどうかを調べるのがF検定です。

まず、carパッケージの読み込みをします。

f:id:cross_hyou:20211218081536p:plain

次は帰無仮説を登録します。こんなようにして登録します。

f:id:cross_hyou:20211218081822p:plain

これで準備は整いました。あとは、linearHypothesis()関数を使います。引数は、回帰モデルと帰無仮説です。

f:id:cross_hyou:20211218082035p:plain

p値は0.7445と0.05よりもうんと大きいです。consn, ggdp23, r2を3つを一つに考えてもlog(unem)とは関係が無いことがわかります。

First Differenceでも推計してみましょう。

f:id:cross_hyou:20211218082542p:plain

お! r1: 第1次産業就業者比率(%)が有意となりました。係数は9.2684e-02, つまり0.092684なので、第1次産業就業者比率が1ポイント上昇すると、失業率が0.09%上昇するということですね。私の感覚では、第1次産業就業者比率が上昇というよりは、第2次、第3次就業者比率が低下すると失業率が上昇、という感じがします。

単独では有意にならなかったtomo, consr, consn, ggdp23, r2を全体で1つとみなしてF検定をしてみます。

f:id:cross_hyou:20211218083446p:plain

p値は0.451でしたので、帰無仮説は棄却できません。

失業率は第1就業者比率(%)と大いに関係があることがわかりました。

今回は以上です。

はじめから読むには、

 

www.crosshyou.info

です。