www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

乗用車ブランド通称名別順位のデータ分析2 - R言語で自作関数を作成。標準偏差、標準誤差、変動係数、信頼区間などを算出。

 

www.crosshyou.info

 の続きです。

今回は標準偏差、標準誤差、変動係数などを計算する関数を作成してみます。

まずは、前回保存したCSVファイルを読み込んでsummary関数で様子を見てみます。

f:id:cross_hyou:20191114195714p:plain

こうなりました。summary関数だと数値データは最小値、第1分位、中央値、平均値、第3分位、最大値、NAの数は表示されますが、標準偏差や変動係数などが表示されません。そこで自作の関数を作ってみました。

f:id:cross_hyou:20191114200828p:plain

こんな感じで作ってみました。

それでは、NumとYoYで試してみます。

まずはNum、販売台数から

f:id:cross_hyou:20191114201122p:plain

r = 2としたら、ちゃんと小数点以下2桁までになりましたね。標準偏差は2921、変動係数は0.72、1標準誤差での平均値の推定は、3775 ~ 4359(n = 100)です。

95%信頼区間での平均値の推定は、34887 ~ 4647(n = 100)です。

前年比(YoY)も見てみます。

f:id:cross_hyou:20191114201508p:plain

こちらもうまくいきました。前年比は8個データが欠損しています。変動係数が1.56ですから販売台数よりもデータのばらつきが大きいことがわかります。

今回は以上です。