Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道県別の定期健康診断結果報告のデータの分析3 - 2015年と2017年の所見率、1事業所当たりの受診者数の比較

www.crosshyou.info

の続きです。前回のグラフで、shokenritsu: 所見率と per_jushin: 1事業所当たりの受診者数は2015年と2017年で若干の差があるように見えました。今回はもう少し詳しく調べてみます。

t.test() 関数で2015年の shokenritsu と2017年の shokenritsu を比較してみます。

paired = TRUE として都道府県を考慮した t検定です。p-value = 0.01856 とありますので、やはり違いがあるのですね。

per_jushin: 1事業所当たりの受診者数も t検定してみます。

p-value = 2.114e-07 ですので統計的に有意に差があります。

どの都道府県の shokenritsu が上がったのか下がったのか?どの都道府県の per_jushin が上がったのか下がったのか?これを調べるためにデータフレームを作ります。

2015年の shokenritsu と per_jushin のデータフレームを作りました。

2017年のデータフレームを作りました。この2つのデータフレームを inner_join() 関数で統合して、差を計算します。

shokenritsu_diff: 2017年と2017年の所見率の差をグラフにしてみます。

京都府が大きく所見率が上昇、福井県が大きく減少していることがわかります。

per_jushin_diff: 1事業所当たりの受診者数の2017年と2015年の差 も同じようにグラフにします。

群馬県が一番、per_jushin_diff が小さい、つまり、1事業所当たりの受診者数が2017年は減少しました。高知県、大分県など数件は増加しています。

shokenritsu_diff と per_jushin_diff の散布図を描いてみます。

あまり関連はなさそうです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# shokenritsu: 所見率が2017年と2015年で差があるか?
t.test(
  df$shokenritsu[df$year == "2015年"],
  df$shokenritsu[df$year == "2017年"],
  paired = TRUE
)
#
# per_jushin: 1事業場当たりの受診者数が2017年と2015年で差があるか?
t.test(
  df$per_jushin[df$year == "2015年"],
  df$per_jushin[df$year == "2017年"],
  paired = TRUE
)
#
# 2015年のデータフレーム
df_2015 <- df |> 
  filter(year == "2015年") |> 
  select(pref, shokenritsu, per_jushin) |> 
  rename(shokenritsu_2015 = shokenritsu,
         per_jushin_2015 = per_jushin)
df_2015
#
# 2017年のデータフレーム
df_2017 <- df |> 
  filter(year == "2017年") |> 
  select(pref, shokenritsu, per_jushin) |> 
  rename(shokenritsu_2017 = shokenritsu,
         per_jushin_2017 = per_jushin)
df_2017
#
# df_2015とdf_2017を統合
df_diff <- df_2015 |> 
  inner_join(df_2017, join_by(pref)) |> 
  mutate(shokenritsu_diff = shokenritsu_2017 - shokenritsu_2015,
         per_jushin_diff = per_jushin_2017 - per_jushin_2015)
glimpse(df_diff)
#
# shokenritsu_diffのグラフ
df_diff |> 
  mutate(pref = reorder(pref, shokenritsu_diff)) |> 
  ggplot(aes(x = pref, y = shokenritsu_diff)) +
  geom_col() +
  coord_flip() +
  theme_minimal()
#
# per_jushin_diffのグラフ
df_diff |> 
  mutate(pref = reorder(pref, per_jushin_diff)) |> 
  ggplot(aes(x = pref, y = per_jushin_diff)) +
  geom_col() +
  coord_flip() +
  theme_minimal()
#
# shokenritsu_diff と per_jushin_diff の散布図
df_diff |> 
  ggplot(aes(x = shokenritsu_diff, y = per_jushin_diff)) +
  geom_point() +
  theme_minimal()
#

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは Natural Landscape of great mountains and blue sky and wide green grass field, close up of yellow Rosa banksiae flowers, photo. です。)