Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気ウォッチャー調査の分野・業種DIのデータの分析3 - R で各変数の平均値を算出

Bing Image Creator で生成: Closeup photo of white lily flowers, background is great amazon river, photo

 

www.crosshyou.info

の続きです。

前回は、景気ウォッチャー調査の total: 総合の値の current: 現状の方向性、future: 先行きの方向性、level: 現状の水準のラインチャートを描いてみました。結果は3つともよく似た動きをしていることがわかりました。

 次は家計と企業の動きを見てみましょう。

current: 現状の方向性のラインチャートです。赤が家計、緑が企業、黒が総合です。

同じような動きですね。

それぞれの平均値と標準偏差を group_by() 関数と summarize() 関数で算出してみましょう。

家計のほうが少し、企業よりも平均値が低く、標準偏差も小さいことがわかります。

全ての変数を type で分けないで平均値を算出してみましょう。

一番平均値の小さいのは、h_r_cloth: 家計動向関連_小売関連_衣料専門店で、37.2です。

一番平均値の大きいのは、employ: 雇用関連です。

この2つのラインチャートを描いてみます。

赤が衣料専門店で緑が雇用です。現状の方向性です。

先行きの方向性のラインチャートを同様に作成します。

水準のチャートを見てみます。

水準が一番、両者の違いが大きい感じですね。

今回は以上です。

次回は

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 家計と企業のグラフ
df |> 
  filter(type == "current") |> 
  ggplot(aes(x = date)) +
  geom_line(aes(y = household), color = "red") +
  geom_line(aes(y = company), color = "green") +
  geom_line(aes(y = total), color = "black")
#
# total, household, companyの統計値
df |> 
  group_by(type) |> 
  summarize(
    avg_total = mean(total, na.rm = TRUE),
    avg_household = mean(household, na.rm = TRUE),
    avg_company = mean(company, na.rm = TRUE),
    sd_total = sd(total, na.rm = TRUE),
    sd_household = sd(household, na.rm = TRUE),
    sd_company = sd(company, na.rm = TRUE)
  )
#
# 全ての変数の平均値
colMeans(df |> select(total:employ), na.rm = TRUE)
#
# h_r_cloth と employ のラインチャート、current
df |> 
  filter(type == "current") |> 
  ggplot(aes(x = date)) +
  geom_line(aes(y = h_r_cloth), color = "red") +
  geom_line(aes(y = employ), color = "green")
#
# h_r_cloth と employ のラインチャート、future
df |> 
  filter(type == "future") |> 
  ggplot(aes(x = date)) +
  geom_line(aes(y = h_r_cloth), color = "red") +
  geom_line(aes(y = employ), color = "green")
#
# h_r_cloth と employ のラインチャート、level
df |> 
  filter(type == "level") |> 
  ggplot(aes(x = date)) +
  geom_line(aes(y = h_r_cloth), color = "red") +
  geom_line(aes(y = employ), color = "green")
#