の続きです。
今回は、bb_gr: ブロードバンドサービス契約数の伸びを他の変数で回帰分析してみようと思います。
まず、散布図マトリックスを描いてみます。R言語のplot関数を使います。
tv_2010, catv_2010, bb_2010は分布が左右対称ではないので、対数変換した値にしましょう。
mutate関数を使います。
もう一度、散布図マトリックスを描いてみます。
select関数で変数を指定するときに、bb_grを一番初めにしたので、散布図マトリックスの1行目が縦軸がbb_grで横軸がその他の変数です。相関関係は弱いようですね。
cor関数で相関係数を確認します。
bb_grは他の変数との相関はほとんど無いですね。tv_2010_lnとcatv_2010_lnが0.868, tv_2010_lnとbb_2010_lnが0.982, bb_2010_lnとcatv_2010_lnが0.914とかなり強い相関ですね。tv_2010_lnとcatv_2010_lnは説明変数からははずしましょう。
それではlm関数で回帰分析をします。
p-valueが0.1784と0.05よりも大きいですね。統計的に有意なモデルでは無い、ということです。
catv_grを削除したモデルを試してみます。
p-valueが0.1283です。0.05よりも大きいので、このモデルも有意ではないです。
bb_2010_lnを削除してみます。
p-valueが0.09045と0.05よりも大きいです。このモデルも有意なモデルでは無いです。
結局、ブロードバンドサービス契約数の伸びは今回の回帰分析で使った変数では説明できないということですね。
他の要因が働いている、ということでしょう。
今回は以上です。
次回は、
です。
はじめからみるには、
です。