Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

賃金構造基本統計調査のデータの分析 1 - R にデータを取り込む

(Bing Image Creatorで生成: prompt: Photos of natural scenery, a solitary island in Japan, with yellow flowers blooming all over.)

今回からしばらくは、賃金構造基本統計調査のデータを分析してみたいと思います。

まず、政府統計の総合窓口、www.e-stat.go.jp からデータを取得します。

賃金構造基本統計調査は、主要産業に雇用される労働者の賃金の実態を明らかにする統計調査だそうです。

一般、都道府県別_年齢階級別DBのデータを選択しました。

男性と女性を選択しました。

年齢階級は、30~34歳と50~54歳を選択しました。

企業規模は、1000人以上と100~999人を選択しました。

産業は卸売業、小売業と金融業、保険業を選択しました。

ダウンロードしたCSVファイルはこんな感じです。15行目に変数名を追加しておきました。

まずは、tidyverseパッケージを読み込みます。

read_csv()関数でCSVファイルを読み込みます。

glimpse()関数で読み込んだデータフレームを確認します。

無事に読み込まれたことが確認できました。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
# tidyverseパッケージ
library(tidyverse)
#
# CSVファイルの読み込み
df_raw <- read_csv("chinginkouzou.csv",
                   skip = 14)
#
# データフレームの確認
glimpse(df_raw)
#