Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の長屋建住宅数のデータの分析7 - R の infer パッケージで、回帰分析の係数の信頼区間を調べる。

Generated by Bing Image Creator: photograph of beautiful grass field and small path, lovely flowers and white clouds

www.crosshyou.info

の続きです。

前回は、infer パッケージで回帰分析の係数の p値を調べました。

今回は、係数の信頼区間を調べます。

はじめに、前回と同様に実際のデータで回帰分析の係数を算出します。

次にブートストラップ法でデータを1000個作って係数を算出します。

boot_distを見てみましょう。

前回と同じような形態のデータフレームです。

visualize() 関数でヒストグラムにします。

get_confidence_interval() 関数で信頼区間を計算できます。

shade_confidence_interval() 関数でヒストグラムに信頼区間を重ねてグラフにすることができます。

l_gdp, l_population ともに信頼区間は 0 を含んでいないです。

lm() 関数で作った回帰分析の結果を confint() 関数で信頼区間を表示してみます。

ブートストラップ法で算出した信頼区間は、

でしたので、だいたい同じような結果になりました。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。