の続きです。
前回はCSVファイルを読み込んだところで終わりました。今回はデータの中身をいろいろ見てみましょう。
summary関数でデータのサマリを見てみます。
NAの行が5つあります。
何でしょうか?
2007年度の北海道、群馬県、愛媛県、2006年度の愛媛県、2005年度の北海道がNAです。
CSVファイルを確認してみます。
たしかにNAでした。
na.omit関数でNAのある行を削除します。
それぞれの変数の平均値、標準偏差、変動係数を算出してみます。
summarise関数, mean関数, sd関数を使っています。男子の50m走の平均値は8.03秒、標準偏差は0.101秒、変動係数は0.0126でした。女子の50m走の平均値は8.86秒、標準偏差は0.128秒、変動係数は0.0144でした。
男子のハンドボール投げの平均値は21.1m, 標準偏差は0.719m, 変動係数は0.0340でした。女子のハンドボール投げの平均値は13.3m, 標準偏差は0.517m, 変動係数は0.0390でした。
男子の立ち幅跳びの平均値は196cm, 標準偏差は3.56cm, 変動係数は0.0182でした。女子の立ち幅跳びの平均値は167cm, 標準偏差は3.61cm, 変動係数は0.0216でした。
こうしてみると、男子のほうが運動能力が高いことと、女子のほうがバラツキ(変動係数)が大きいことがわかります。
今回は以上です。