Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の睡眠の平均時間のデータの分析 1 - RにCSVファイルのデータを読み込む。無業者の男子と有業者女子で1時間以上、平均睡眠時間に差がある。

Generated by Bing Image Creator: Beautiful Photo, tropical coral sea, colorful fishes

今回は、政府統計の総合窓口(e-stat)から都道府県別の睡眠時間のデータを分析してみましょう。

男性と女性で睡眠時間に差があるのか?10歳以上と15歳以上で差があるのか?有業者と無業者で差があるのか?都道府県別で差があるのか?などを調べてみましょう。

まず、データ表示 | 都道府県データ | 社会・人口統計体系 | 地域から探す | 政府統計の総合窓口 (e-stat.go.jp)

のウェブサイトからデータをダウンロードします。

このようなCSVファイルです。

これをRに読み込ませます。

前準備で、tidyverseパッケージを読み込んでおきます。

read_csv()関数でデータを読み込みます。

glimpse()関数でどんな感じかみてみます。

yearとprefをファクター型に変更して、NAの行を削除しましょう。

glimpse()関数で様子をみてみましょう。

141行 x 12列のデータフレームです。

ここで変数名が何を表しているかを確認しましょう。

year: 年度

pref: 都道府県名

pop: 人口【人】

gdp: 平成17年基準の県内総生産額【百万円】

m10: 10歳以上男子の平均睡眠時間【分】

m15: 15歳以上男子の平均睡眠時間【分】

mw: 有業者男子の平均睡眠時間【分】

mnw: 無業者男子の平均睡眠時間【分】

f10: 10歳以上女子の平均睡眠時間【分】

f15: 15歳以上女子の平均睡眠時間【分】

fw: 有業者女子の平均睡眠時間【分】

fnw: 無業者女子の平均睡眠時間【分】

です。

summary()関数で各変数の平均値などを確認します。

睡眠時間の平均値が一番長いのは、mnw: 無業者男子で、507分です。

その反対に一番短いのは、fw: 有業者女子で、438分です。1時間以上の差がありますね。

今回は以上です。

次回は、

www.crosshyou.info

です。