
今回からしばらくは、都道府県別の病院報告のデータの分析をしたいと思います。
政府統計の総合窓口、e-statのウェブサイトからデータを取得します。

令和5年の人口10万人対1日平均患者数のデータと

令和3年のデータを取得します。


ダウンロードしたファイルを少し加工して、このようなCSVファイルにしました。
これをRに取り込んで分析します。
まず、tidyverseパッケージの読み込みをします。

ファイルを読み込みます。

glimpse()関数でデータフレームの様子をみてみます。

特に問題なく読み込んだようです。
2つのデータフレームを合体させます。

data, pref, yearをファクター型にします。

dataのファクターレベルを確認します。

3つの水準がありますが、違うのは、在院、新入院、退院のところだけなので、ファクターレベルを書き換えます

在院はzai, 新入院はnyu, 退院はtaiに書き換えました。
dataという変数名をtypeという変数名に書き換えます。

変数の並び順を変えます。

これで、とりあえず分析用のデータフレームが整いました。
今回は以上です。
次回は、
です。
今回のコードは以下になります。
#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# ファイルの読み込み
df_r3_raw <- read_csv("r3_byouin.csv",
skip = 11)
#
df_r5_raw <- read_csv("r5_byouin.csv",
skip = 11)
#
# データフレームの様子
glimpse(df_r3_raw)
#
# 2つのデータフレームを合体
df <-
bind_rows(
df_r3_raw |> mutate(year = "r3"),
df_r5_raw |> mutate(year = "r5")
)
df
#
# data, pref, yearをファクター型に
df <- df |>
mutate(
data = as.factor(data),
pref = as.factor(pref),
year = as.factor(year)
)
df
#
# dataのファクターレベル
levels(df$data)
#
# ファクターレベルの書き換え
levels(df$data) <- c("zai", "nyu", "tai")
df
#
# dataとtypeに
df <- df |>
rename(type = data)
df
#
# 変数の並び順を変更
df <- df |>
select(pref, year, type, total, seishin, ippan)
df
#
(冒頭の画像は Bing Image Creator で生成しました。プロンプトは Beautiful red spider lilies blooming in a natural meadow. です。)