今回は、前回のブログ、
の続きで、R言語を使って成長性・規模、裕福さの3つの指標の偏差値を算出してそれらを合計した総合スコアを計算しようと思います。
まずは、前回作成したデータフレームを再掲します。
偏差値はどうやって計算するかというと、
(原データ - 平均値) / 標準偏差 * 10 + 50
という式です。平均値はmean関数、標準偏差はsd関数で求められますので、簡単に計算できます。
このような計算式ですね。そして、こうして作成したデータ・フレームをhead関数で最初の6行だけ表示すると、以下のようになります。
北海道の成長性偏差値は43ぐらい、規模の偏差値は61ぐらい、裕福さの偏差値は43ぐらいだとわかります。偏差値は平均値が50ですから、北海道は規模は平均以上ですが、成長性や裕福さは平均以下だとわかります。偏差値の平均値が50だということをsummary関数で確認してみましょう。
それでは、成長性偏差値 + 経済規模偏差値 + 裕福さ偏差値を計算して総合スコアを算出しましょう。
data2$総合スコア~~~ で総合スコアを計算し、
総合スコア <- data2$総合スコア で総合スコアのベクトルを作成し、
names(総合スコア) <- data2$都道府県 でそのベクトルの各要素に都道府県の名前をつけています。
そして、barplot(sort(総合スコア, decreasing = TRUE)) で棒グラフを表示します。
実際の値を表示しましょう。
総合スコア上位は、東京、愛知、兵庫などでした。
今回はここまでです。
次回は下記のリンクからご覧ください。