crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のケーブルテレビ加入世帯数のデータの分析5 - ブロードバンドサービス契約数の伸びを回帰分析する。

 

www.crosshyou.info

 の続きです。

今回は、bb_gr: ブロードバンドサービス契約数の伸びを他の変数で回帰分析してみようと思います。

まず、散布図マトリックスを描いてみます。R言語のplot関数を使います。

f:id:cross_hyou:20210211094913p:plain

f:id:cross_hyou:20210211094929p:plain

tv_2010, catv_2010, bb_2010は分布が左右対称ではないので、対数変換した値にしましょう。

mutate関数を使います。

f:id:cross_hyou:20210211095338p:plain

もう一度、散布図マトリックスを描いてみます。

f:id:cross_hyou:20210211095622p:plain

f:id:cross_hyou:20210211095843p:plain

select関数で変数を指定するときに、bb_grを一番初めにしたので、散布図マトリックスの1行目が縦軸がbb_grで横軸がその他の変数です。相関関係は弱いようですね。

cor関数で相関係数を確認します。

f:id:cross_hyou:20210211100322p:plain

bb_grは他の変数との相関はほとんど無いですね。tv_2010_lnとcatv_2010_lnが0.868, tv_2010_lnとbb_2010_lnが0.982, bb_2010_lnとcatv_2010_lnが0.914とかなり強い相関ですね。tv_2010_lnとcatv_2010_lnは説明変数からははずしましょう。

それではlm関数で回帰分析をします。

f:id:cross_hyou:20210211101134p:plain

p-valueが0.1784と0.05よりも大きいですね。統計的に有意なモデルでは無い、ということです。

catv_grを削除したモデルを試してみます。

f:id:cross_hyou:20210211101856p:plain

p-valueが0.1283です。0.05よりも大きいので、このモデルも有意ではないです。

bb_2010_lnを削除してみます。

f:id:cross_hyou:20210211102148p:plain

p-valueが0.09045と0.05よりも大きいです。このモデルも有意なモデルでは無いです。

結局、ブロードバンドサービス契約数の伸びは今回の回帰分析で使った変数では説明できないということですね。

他の要因が働いている、ということでしょう。

今回は以上です。

次回は、

 

www.crosshyou.info

 です。

 

はじめからみるには、

 

www.crosshyou.info

 です。