今回は都道府県別の中二生徒のスポーツテストのデータを分析してみます。
政府統計の総合窓口、e-Stat(www.e-stat.go.jp)からデータを取得しました。
50m走、ハンドボール投げ、立ち幅跳びの3種目です。
データのCSVファイルはこのようなものです。9行目に私が変数名を挿入しました。
調査年:year
都道府県名:pref
男子の50m走【秒】:m_50m
女子の50m走【秒】:f_50m
男子のハンドボール投げ【m】:m_ball
女子のハンドボール投げ【m】:f_ball
男子の立ち幅跳び【cm】:m_jump
女子の立ち幅跳び【cm】:f_jump
です。
とりあえず、R言語のtidyverseパッケージを読み込んでおきます。
せっかくtidyverseを読み込んだので、read.csv関数ではなくて、read_csv関数でファイルを読み込んでみます。
read_csv関数で読み込んだデータはデータフレームではなくて、tibbleというものになります。
青枠で囲ったところがtibbleの特徴です。611行、8列とデータの大きさが表示され、
<chr>, <dbl>と変数の型がわかります。文字列型と数値型です。そして、全部が表示されなくてはじめの10行が表示されています。
今回は以上です。