の続きです。
前回作成した、それぞれの伸び率、tv_gr: テレビ放送受信契約数の伸び、catv_gr: ケーブルテレビ加入世帯数の伸び、 bb_gr: ブロードバンドサービス契約数の伸びの平均値の信頼区間を調べてみようと思います。
まずは、パラメトリック法による信頼区間です。
まず、tv_grの平均値とその信頼区間を求めましょう。
平均値をmean関数で、分散をvar関数で、サンプル数をlength関数で求めます。
次に標準誤差(se)を求めます。分散をサンプル数で割って、平方根をとったものです。
95%の信頼区間は、平均値 ± t(α=0.025, d.f.)で求められます。
avg_tv_gr ± qt(0.975, n_tv_gr - 1) * se_tv_gr
ですね。
tv_grの95%の信頼区間は、1.072552から1.094954です。
同じようにして、catv_grの信頼区間をパラメトリック方式で求めましょう。
はじめに信頼区間を作成する関数を作りました。
tv_grでうまく計算されるかテストしてみます。
さきほどの計算結果と一致していますので、関数はうまく動いています。
この関数を使って、catv_grの95%信頼区間を求めましょう。
catv_grの平均値95%信頼区間は0.8770051から0.9605034です。
bb_grも同じようにやってみます。
bb_grの平均値95%信頼区間は5.724841から6.223085です。
つぎに、Bootstrap方式で平均値の信頼区間を求めましょう。
まず、繰り返す回数を決定します。今回は1万回にします。
そして、tv_grをランダムに47個抜き出し、平均値を計算する、これを1万回繰り返します。
平均値を入れる箱を作っておきます。
データからランダムに抜き出し、平均値を計算する関数を作ります。
replicate関数で1万回繰り返します。
hist関数でhakoのヒストグラムを描いてみます。
quantile関数で信頼区間を求めます。
パラメトリック法で求めた信頼区間(1.072552から1.094954)と同じくらいの数値ですね。
catv_gr, bb_grについても同じように求めてみます。
まず、catv_grからです。
これもパラメトリック法での信頼区間(0.8770051から0.9605034)と似た数値です。
bb_grも求めます。
これもパラメトリック法での信頼区間(5.724841から6.223085)と似た数値です。
今回は以上です。
次回は
です。
はじめから読むには、
です。