
の続きです。前回のグラフで、shokenritsu: 所見率と per_jushin: 1事業所当たりの受診者数は2015年と2017年で若干の差があるように見えました。今回はもう少し詳しく調べてみます。
t.test() 関数で2015年の shokenritsu と2017年の shokenritsu を比較してみます。

paired = TRUE として都道府県を考慮した t検定です。p-value = 0.01856 とありますので、やはり違いがあるのですね。
per_jushin: 1事業所当たりの受診者数も t検定してみます。

p-value = 2.114e-07 ですので統計的に有意に差があります。
どの都道府県の shokenritsu が上がったのか下がったのか?どの都道府県の per_jushin が上がったのか下がったのか?これを調べるためにデータフレームを作ります。

2015年の shokenritsu と per_jushin のデータフレームを作りました。

2017年のデータフレームを作りました。この2つのデータフレームを inner_join() 関数で統合して、差を計算します。

shokenritsu_diff: 2017年と2017年の所見率の差をグラフにしてみます。


京都府が大きく所見率が上昇、福井県が大きく減少していることがわかります。
per_jushin_diff: 1事業所当たりの受診者数の2017年と2015年の差 も同じようにグラフにします。


群馬県が一番、per_jushin_diff が小さい、つまり、1事業所当たりの受診者数が2017年は減少しました。高知県、大分県など数件は増加しています。
shokenritsu_diff と per_jushin_diff の散布図を描いてみます。


あまり関連はなさそうです。
今回は以上です。
次回は、
です。
はじめから読むには、
です。
今回のコードは以下になります。
#
# shokenritsu: 所見率が2017年と2015年で差があるか?
t.test(
df$shokenritsu[df$year == "2015年"],
df$shokenritsu[df$year == "2017年"],
paired = TRUE
)
#
# per_jushin: 1事業場当たりの受診者数が2017年と2015年で差があるか?
t.test(
df$per_jushin[df$year == "2015年"],
df$per_jushin[df$year == "2017年"],
paired = TRUE
)
#
# 2015年のデータフレーム
df_2015 <- df |>
filter(year == "2015年") |>
select(pref, shokenritsu, per_jushin) |>
rename(shokenritsu_2015 = shokenritsu,
per_jushin_2015 = per_jushin)
df_2015
#
# 2017年のデータフレーム
df_2017 <- df |>
filter(year == "2017年") |>
select(pref, shokenritsu, per_jushin) |>
rename(shokenritsu_2017 = shokenritsu,
per_jushin_2017 = per_jushin)
df_2017
#
# df_2015とdf_2017を統合
df_diff <- df_2015 |>
inner_join(df_2017, join_by(pref)) |>
mutate(shokenritsu_diff = shokenritsu_2017 - shokenritsu_2015,
per_jushin_diff = per_jushin_2017 - per_jushin_2015)
glimpse(df_diff)
#
# shokenritsu_diffのグラフ
df_diff |>
mutate(pref = reorder(pref, shokenritsu_diff)) |>
ggplot(aes(x = pref, y = shokenritsu_diff)) +
geom_col() +
coord_flip() +
theme_minimal()
#
# per_jushin_diffのグラフ
df_diff |>
mutate(pref = reorder(pref, per_jushin_diff)) |>
ggplot(aes(x = pref, y = per_jushin_diff)) +
geom_col() +
coord_flip() +
theme_minimal()
#
# shokenritsu_diff と per_jushin_diff の散布図
df_diff |>
ggplot(aes(x = shokenritsu_diff, y = per_jushin_diff)) +
geom_point() +
theme_minimal()
#
(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは Natural Landscape of great mountains and blue sky and wide green grass field, close up of yellow Rosa banksiae flowers, photo. です。)