crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のケーブルテレビ加入世帯数のデータの分析4 - R言語で平均値の信頼区間をパラメトリック法とブートストラップ法で求める。

 

www.crosshyou.info

の続きです。

前回作成した、それぞれの伸び率、tv_gr: テレビ放送受信契約数の伸び、catv_gr: ケーブルテレビ加入世帯数の伸び、 bb_gr: ブロードバンドサービス契約数の伸びの平均値の信頼区間を調べてみようと思います。

まずは、パラメトリック法による信頼区間です。

まず、tv_grの平均値とその信頼区間を求めましょう。

平均値をmean関数で、分散をvar関数で、サンプル数をlength関数で求めます。

f:id:cross_hyou:20210207090212p:plain

次に標準誤差(se)を求めます。分散をサンプル数で割って、平方根をとったものです。

f:id:cross_hyou:20210207090918p:plain


95%の信頼区間は、平均値 ± t(α=0.025, d.f.)で求められます。

avg_tv_gr ± qt(0.975, n_tv_gr - 1) * se_tv_gr

ですね。

f:id:cross_hyou:20210207092747p:plain

tv_grの95%の信頼区間は、1.072552から1.094954です。

同じようにして、catv_grの信頼区間をパラメトリック方式で求めましょう。

はじめに信頼区間を作成する関数を作りました。

f:id:cross_hyou:20210207093816p:plain

tv_grでうまく計算されるかテストしてみます。

f:id:cross_hyou:20210207093912p:plain

さきほどの計算結果と一致していますので、関数はうまく動いています。

この関数を使って、catv_grの95%信頼区間を求めましょう。

f:id:cross_hyou:20210207094111p:plain

catv_grの平均値95%信頼区間は0.8770051から0.9605034です。

bb_grも同じようにやってみます。

f:id:cross_hyou:20210207094305p:plain

bb_grの平均値95%信頼区間は5.724841から6.223085です。

つぎに、Bootstrap方式で平均値の信頼区間を求めましょう。

まず、繰り返す回数を決定します。今回は1万回にします。

f:id:cross_hyou:20210207094641p:plain

そして、tv_grをランダムに47個抜き出し、平均値を計算する、これを1万回繰り返します。

平均値を入れる箱を作っておきます。

f:id:cross_hyou:20210207095035p:plain

データからランダムに抜き出し、平均値を計算する関数を作ります。

f:id:cross_hyou:20210207095647p:plain

replicate関数で1万回繰り返します。

f:id:cross_hyou:20210207095933p:plain

hist関数でhakoのヒストグラムを描いてみます。

f:id:cross_hyou:20210207100034p:plain

f:id:cross_hyou:20210207100108p:plain

quantile関数で信頼区間を求めます。

f:id:cross_hyou:20210207100252p:plain

パラメトリック法で求めた信頼区間(1.072552から1.094954)と同じくらいの数値ですね。

catv_gr, bb_grについても同じように求めてみます。

まず、catv_grからです。

f:id:cross_hyou:20210207101348p:plain

これもパラメトリック法での信頼区間(0.8770051から0.9605034)と似た数値です。

 

bb_grも求めます。

f:id:cross_hyou:20210207101715p:plain

これもパラメトリック法での信頼区間(5.724841から6.223085)と似た数値です。
今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。