Bing Image Creator で生成: Landscape of Singapore bay area, in the morning, photo
今回は、政府統計の総合窓口(www.e-stat.go.jp)から、企業行動に関するアンケート調査のデータをダウンロードして、Rで分析をしてみたいと思います。
我が国の名目経済成長率見通し(次年度)のデータをダウンロードしてみます。
下のような表です。これをCSVファイルにダウンロードしました。
下のように、年度次、産業、回答企業数、実数値平均、標準偏差の5つの変数だけを残しました。
これをRに読み込みます。
まずは、なにはさておき、tidyverseパッケージを読み込みます。
そうしたら、read_csv()関数でCSVファイルのデータをRに読み込みます。
9行目からが読み込むデータなので、skip = 8 で8行スキップします。
glimpse()関数でデータフレームをみてみます。
このデータフレームをもう少し加工して分析しやすいようにします。
yearをファクター型の変数に変換するのと、数値型の変数を生成します。
sectorをファクター型の変数にします。
summary()関数でこのデータフレームで処理してみましょう。
はい、このように分析しやすくなりました。
次回以降は、sector別のforecastの違いはあるのか?year別にforecastの違いはあるのか?などをチェックしていきたいとと思います。
今回は以上です。
次回は、
です。
今回のRのコードは以下になります。
# tidyverseパッケージを読み込む
library(tidyverse)
#
# CSVファイルを読み込む
df <- read_csv("kigyo_ankeito.csv",
skip = 8)
#
# glimpse()でデータフレームを確認
glimpse(df)
#
#
# dfの加工
df <- df |>
mutate(
y = parse_number(year), # yearをファクター型の変数にする
year = as.factor(year), # yearから数値型の変数を生成
sector = as.factor(sector) # sectorをファクター型の変数にする
)
glimpse(df)
#
# summary()
summary(df)