Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の病院報告のデータの分析 1 - Rにデータを取り込む

今回からしばらくは、都道府県別の病院報告のデータの分析をしたいと思います。

政府統計の総合窓口、e-statのウェブサイトからデータを取得します。

令和5年の人口10万人対1日平均患者数のデータと

令和3年のデータを取得します。

ダウンロードしたファイルを少し加工して、このようなCSVファイルにしました。

これをRに取り込んで分析します。

まず、tidyverseパッケージの読み込みをします。

ファイルを読み込みます。

glimpse()関数でデータフレームの様子をみてみます。

特に問題なく読み込んだようです。

2つのデータフレームを合体させます。

data, pref, yearをファクター型にします。

dataのファクターレベルを確認します。

3つの水準がありますが、違うのは、在院、新入院、退院のところだけなので、ファクターレベルを書き換えます

在院はzai, 新入院はnyu, 退院はtaiに書き換えました。

dataという変数名をtypeという変数名に書き換えます。

変数の並び順を変えます。

これで、とりあえず分析用のデータフレームが整いました。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# ファイルの読み込み
df_r3_raw <- read_csv("r3_byouin.csv",
                      skip = 11)
#
df_r5_raw <- read_csv("r5_byouin.csv",
                      skip = 11)
#
# データフレームの様子
glimpse(df_r3_raw)
#
# 2つのデータフレームを合体
df <-
  bind_rows(
    df_r3_raw |> mutate(year = "r3"),
    df_r5_raw |> mutate(year = "r5")
)
df
#
# data, pref, yearをファクター型に
df <- df |> 
  mutate(
    data = as.factor(data),
    pref = as.factor(pref),
    year = as.factor(year)
  )
df
#
# dataのファクターレベル
levels(df$data)
#
# ファクターレベルの書き換え
levels(df$data) <- c("zai", "nyu", "tai")
df
#
# dataとtypeに
df <- df |> 
  rename(type = data)
df
#
# 変数の並び順を変更
df <- df |> 
  select(pref, year, type, total, seishin, ippan)
df
#

(冒頭の画像は Bing Image Creator で生成しました。プロンプトは Beautiful red spider lilies blooming in a natural meadow. です。)