(Bing Image Creator で生成: プロンプト: Landscape of Nemophila menziesii flowers hill, blue sky and white cloud, nobody is there, photo)
の続きです。
今回も Jeffrey M. WooldridgeのIntroductory Econometrics A Modern Approach 7e
を参考書にしています。
前回作成した、level-levelモデルをsummary()関数でみてみます。
今回は、このsummary()関数の結果のResidual standard error: 1602とStd. Errorの315.4829と0.1366がどのように計算されているかを確かめます。
まず、nを定義します。これは観測数の数です。今回は47都道府県なので47です。
次はSSR(Residual Sum of Squares)を定義します。残差の2乗の合計です。
このnとSSRから、SER(Standard Error of Regression)が計算できます。
1602.072という数値がでました。これが、Residual standard error: 1602ですね。
SSR / (n -2) というのは、残差の分散の推定値です。それの平方根がSERなので、SERは残差の標準偏差の推定値という意味合いがあります。
こんどは、pop1000のほうのStd.Errorの0.1366を算出してみます。
SST for pop1000を計算します。
pop1000のStd. Error は SER / sqrt(SST for pop1000)です。
0.1366015とsummary()関数の結果と一致しました。
切片のほうのStd. Errorも算出します。
pop1000を2乗したものの合計が必要です。
X_sq_total, SER, SST_pop1000, n を使います。
315.4829とsummary()関数の結果と一致しました。
無事にsummary()関数のResidual standard error, Std. Errorが確認できました。
今回は以上です。
次回は
です。
初めから読むには、
です。
今回のコードは以下になります。
#
# model_lev_levのサマリー
summary(model_lev_lev)
#
# nを定義
n <- nrow(df_2020)
n
#
# SSRの計算
SSR <- sum(resid(model_lev_lev)^2)
SSR
#
# SER(Standard Error of Regression)の計算
SER <- sqrt(SSR / (n - 2))
SER
#
#SST for pop1000を計算
SST_pop1000 <- sum*1^2)
SST_pop1000
#
# pop1000のStd. Error
SER / sqrt(SST_pop1000)
#
# pop1000の2乗の合計値
X_sq_total <- sum(df_2020$pop1000^2)
X_sq_total
#
# 切片のStd. Error
sqrt((SER^2 / n * X_sq_total) / SST_pop1000)
#
*1:df_2020$pop1000 - mean(df_2020$pop1000