Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の中二生徒のスポーツテストのデータ分析1 - R言語でデータを読み込む。

今回は都道府県別の中二生徒のスポーツテストのデータを分析してみます。

政府統計の総合窓口、e-Stat(www.e-stat.go.jp)からデータを取得しました。

f:id:cross_hyou:20201024181517p:plain

50m走、ハンドボール投げ、立ち幅跳びの3種目です。

f:id:cross_hyou:20201024181609p:plain

データのCSVファイルはこのようなものです。9行目に私が変数名を挿入しました。

調査年:year

都道府県名:pref

男子の50m走【秒】:m_50m

女子の50m走【秒】:f_50m

男子のハンドボール投げ【m】:m_ball

女子のハンドボール投げ【m】:f_ball

男子の立ち幅跳び【cm】:m_jump

女子の立ち幅跳び【cm】:f_jump

です。

とりあえず、R言語のtidyverseパッケージを読み込んでおきます。

f:id:cross_hyou:20201024182525p:plain

せっかくtidyverseを読み込んだので、read.csv関数ではなくて、read_csv関数でファイルを読み込んでみます。

f:id:cross_hyou:20201024183450p:plain

read_csv関数で読み込んだデータはデータフレームではなくて、tibbleというものになります。

f:id:cross_hyou:20201024183743p:plain

青枠で囲ったところがtibbleの特徴です。611行、8列とデータの大きさが表示され、

<chr>, <dbl>と変数の型がわかります。文字列型と数値型です。そして、全部が表示されなくてはじめの10行が表示されています。

今回は以上です。