crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の中二生徒のスポーツテストのデータ分析3 - 福井県が一番スポーツテストの成績が良い。

 

www.crosshyou.info

 の続きです。

今回は都道府県別の平均値を計算して、都道府県別のランキングを作成してみます。

まずは、group_by関数、summarise関数、mean関数を使います。

f:id:cross_hyou:20201031104458p:plain

data_prefという名前で保存しました。

arrange関数でそれぞれの項目で並び替えます。

f:id:cross_hyou:20201031104642p:plain

男子50m走は茨城県と福井県が7.85秒で一番早いです。

f:id:cross_hyou:20201031104812p:plain

女子50m走は茨城県が8.62秒で一番です。2番が福井県です。

f:id:cross_hyou:20201031104954p:plain

男子ハンドボール投げは沖縄県が22.5mで一番です。二番は福井県です。

f:id:cross_hyou:20201031105120p:plain

女子ハンドボール投げは茨城県が一番です。沖縄県、岩手県、福井県が2番です。

f:id:cross_hyou:20201031105250p:plain

男子立ち幅跳びは福井県が202cmで一番です。新潟県、秋田県が二番です。

f:id:cross_hyou:20201031105435p:plain

女子立ち幅跳びは福井県が一番です。茨城県と静岡県が二番です。

こうしてみると、福井県が一番スポーツテストの成績はいいようですね。

総合点を作ってみましょう。

f:id:cross_hyou:20201031110540p:plain

scale関数で標準化した値を計算します。50m走は50で割って速度にしてから標準化しています。これで、どの項目も値が大きいほど優秀ということになります。

f:id:cross_hyou:20201031110823p:plain

標準化した値を合計してtotal_scoreという名前で保存しました。

f:id:cross_hyou:20201031111003p:plain

totaLscoreの大きい順にarrange(desc(total_score))で並び替えました。

やっぱり福井県が一番ですね。茨城県、静岡県と続きます。

グラフで表示してみます。ggplot2のgeom_bar関数を使います。

f:id:cross_hyou:20201031112316p:plain

mutateの行でprefをtotal_scoreの順に並び替えています。

ggplotの行で、X軸をpref, Y軸をtotal_scoreに設定しています。

geom_barの行で棒グラフを描きます。stat="identity"としているので、total_scoreの値で棒グラフを描きます。

coord_flipの行でX軸とY軸を反転します。

xlabの行でX軸のラベルを消します。

themeの行でテキストのサイズを6にしています。

f:id:cross_hyou:20201031112726p:plain

今回は以上です。