の続きです。
今回は都道府県別の平均値を計算して、都道府県別のランキングを作成してみます。
まずは、group_by関数、summarise関数、mean関数を使います。
data_prefという名前で保存しました。
arrange関数でそれぞれの項目で並び替えます。
男子50m走は茨城県と福井県が7.85秒で一番早いです。
女子50m走は茨城県が8.62秒で一番です。2番が福井県です。
男子ハンドボール投げは沖縄県が22.5mで一番です。二番は福井県です。
女子ハンドボール投げは茨城県が一番です。沖縄県、岩手県、福井県が2番です。
男子立ち幅跳びは福井県が202cmで一番です。新潟県、秋田県が二番です。
女子立ち幅跳びは福井県が一番です。茨城県と静岡県が二番です。
こうしてみると、福井県が一番スポーツテストの成績はいいようですね。
総合点を作ってみましょう。
scale関数で標準化した値を計算します。50m走は50で割って速度にしてから標準化しています。これで、どの項目も値が大きいほど優秀ということになります。
標準化した値を合計してtotal_scoreという名前で保存しました。
totaLscoreの大きい順にarrange(desc(total_score))で並び替えました。
やっぱり福井県が一番ですね。茨城県、静岡県と続きます。
グラフで表示してみます。ggplot2のgeom_bar関数を使います。
mutateの行でprefをtotal_scoreの順に並び替えています。
ggplotの行で、X軸をpref, Y軸をtotal_scoreに設定しています。
geom_barの行で棒グラフを描きます。stat="identity"としているので、total_scoreの値で棒グラフを描きます。
coord_flipの行でX軸とY軸を反転します。
xlabの行でX軸のラベルを消します。
themeの行でテキストのサイズを6にしています。
今回は以上です。