Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東証の業種別空売りデータの分析2 - R言語で算術平均、幾何平均、調和平均、中央値を計算する。

 

www.crosshyou.infoの続きです。

今回は、Michael J. Crawley著 Statistics An introduction using Rの第3章、Central Tendencyを参考にして分析の練習をしてみます。

まずは、hist関数でヒストグラムを描きます。

f:id:cross_hyou:20200614140831j:plain

f:id:cross_hyou:20200614140845j:plain

規制有りは左の裾野が広く、規制無しと前日比は右の裾野が広い分布です。

平均値、中央値もヒストグラムに付け足しましょう。

f:id:cross_hyou:20200614141419j:plain

f:id:cross_hyou:20200614141435j:plain

赤が平均値、青が中央値を表す垂線です。

mean関数が算術平均、median関数が中央値です。

その他、幾何平均(geometric mean)と調和平均(harmonic mean)というのがあります。

これらのCentral Tendencyを計算する関数を作ります。

f:id:cross_hyou:20200614150508j:plain

if構文は

if(条件式) {

条件式がTRUEの時に実行するコマンド

} else {

条件式がFASLEの時に実行するコマンド

}
という構文です。

こうして作成したcentral_tendency関数を実行してみます。

f:id:cross_hyou:20200614144614j:plain

できました。

算術平均は、mean関数で計算できます。

幾何平均は、exp(mean(log(x)))で計算できます。

調和平均は、1/mean(1/x)で計算できます。

中央値は、median関数で計算できます。
今回は以上です。

今回の参考図書は、

 

でした。