Generated by Bing Image Creator: Beautiful Photo, tropical coral sea, colorful fishes
今回は、政府統計の総合窓口(e-stat)から都道府県別の睡眠時間のデータを分析してみましょう。
男性と女性で睡眠時間に差があるのか?10歳以上と15歳以上で差があるのか?有業者と無業者で差があるのか?都道府県別で差があるのか?などを調べてみましょう。
まず、データ表示 | 都道府県データ | 社会・人口統計体系 | 地域から探す | 政府統計の総合窓口 (e-stat.go.jp)
のウェブサイトからデータをダウンロードします。
このようなCSVファイルです。
これをRに読み込ませます。
前準備で、tidyverseパッケージを読み込んでおきます。
read_csv()関数でデータを読み込みます。
glimpse()関数でどんな感じかみてみます。
yearとprefをファクター型に変更して、NAの行を削除しましょう。
glimpse()関数で様子をみてみましょう。
141行 x 12列のデータフレームです。
ここで変数名が何を表しているかを確認しましょう。
year: 年度
pref: 都道府県名
pop: 人口【人】
gdp: 平成17年基準の県内総生産額【百万円】
m10: 10歳以上男子の平均睡眠時間【分】
m15: 15歳以上男子の平均睡眠時間【分】
mw: 有業者男子の平均睡眠時間【分】
mnw: 無業者男子の平均睡眠時間【分】
f10: 10歳以上女子の平均睡眠時間【分】
f15: 15歳以上女子の平均睡眠時間【分】
fw: 有業者女子の平均睡眠時間【分】
fnw: 無業者女子の平均睡眠時間【分】
です。
summary()関数で各変数の平均値などを確認します。
睡眠時間の平均値が一番長いのは、mnw: 無業者男子で、507分です。
その反対に一番短いのは、fw: 有業者女子で、438分です。1時間以上の差がありますね。
今回は以上です。
次回は、
です。