Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

企業行動に関するアンケート調査のデータ分析1 - CSVにあるデータをRに読み込む。

Bing Image Creator で生成: Landscape of Singapore bay area, in the morning, photo

今回は、政府統計の総合窓口(www.e-stat.go.jp)から、企業行動に関するアンケート調査のデータをダウンロードして、Rで分析をしてみたいと思います。

我が国の名目経済成長率見通し(次年度)のデータをダウンロードしてみます。

下のような表です。これをCSVファイルにダウンロードしました。

下のように、年度次、産業、回答企業数、実数値平均、標準偏差の5つの変数だけを残しました。

これをRに読み込みます。

まずは、なにはさておき、tidyverseパッケージを読み込みます。

そうしたら、read_csv()関数でCSVファイルのデータをRに読み込みます。

9行目からが読み込むデータなので、skip = 8 で8行スキップします。

glimpse()関数でデータフレームをみてみます。

このデータフレームをもう少し加工して分析しやすいようにします。

yearをファクター型の変数に変換するのと、数値型の変数を生成します。

sectorをファクター型の変数にします。

summary()関数でこのデータフレームで処理してみましょう。

はい、このように分析しやすくなりました。

次回以降は、sector別のforecastの違いはあるのか?year別にforecastの違いはあるのか?などをチェックしていきたいとと思います。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

今回のRのコードは以下になります。

# tidyverseパッケージを読み込む
library(tidyverse)
#
# CSVファイルを読み込む
df <- read_csv("kigyo_ankeito.csv",
               skip = 8)
#
# glimpse()でデータフレームを確認
glimpse(df)
#
#
# dfの加工
df <- df |> 
  mutate(
    y = parse_number(year), # yearをファクター型の変数にする
    year = as.factor(year), # yearから数値型の変数を生成
    sector = as.factor(sector) # sectorをファクター型の変数にする
         )
glimpse(df)
#
# summary()
summary(df)