Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の道路平均交通量の分析6 - SER(Standard Error of Regression)の算出

(Bing Image Creator で生成: プロンプト: Landscape of Nemophila menziesii flowers hill, blue sky and white cloud, nobody is there, photo)

www.crosshyou.info

の続きです。

今回も Jeffrey M. WooldridgeのIntroductory Econometrics A Modern Approach 7e

を参考書にしています。

 

前回作成した、level-levelモデルをsummary()関数でみてみます。

今回は、このsummary()関数の結果のResidual standard error: 1602とStd. Errorの315.4829と0.1366がどのように計算されているかを確かめます。

まず、nを定義します。これは観測数の数です。今回は47都道府県なので47です。

次はSSR(Residual Sum of Squares)を定義します。残差の2乗の合計です。

このnとSSRから、SER(Standard Error of Regression)が計算できます。

1602.072という数値がでました。これが、Residual standard error: 1602ですね。

SSR / (n -2) というのは、残差の分散の推定値です。それの平方根がSERなので、SERは残差の標準偏差の推定値という意味合いがあります。

こんどは、pop1000のほうのStd.Errorの0.1366を算出してみます。

SST for pop1000を計算します。

pop1000のStd. Error は SER / sqrt(SST for pop1000)です。

0.1366015とsummary()関数の結果と一致しました。

切片のほうのStd. Errorも算出します。

pop1000を2乗したものの合計が必要です。

X_sq_total, SER, SST_pop1000, n を使います。

315.4829とsummary()関数の結果と一致しました。

無事にsummary()関数のResidual standard error, Std. Errorが確認できました。

今回は以上です。

次回は

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# model_lev_levのサマリー
summary(model_lev_lev)
#
# nを定義
n <- nrow(df_2020)
n
#
# SSRの計算
SSR <- sum(resid(model_lev_lev)^2)
SSR
#
# SER(Standard Error of Regression)の計算
SER <- sqrt(SSR / (n - 2))
SER
#
#SST for pop1000を計算
SST_pop1000 <- sum*1^2)
SST_pop1000
#
# pop1000のStd. Error
SER / sqrt(SST_pop1000)
#
# pop1000の2乗の合計値
X_sq_total <- sum(df_2020$pop1000^2)
X_sq_total
#
# 切片のStd. Error
sqrt((SER^2 / n * X_sq_total) / SST_pop1000)
#

 

 

*1:df_2020$pop1000 - mean(df_2020$pop1000