Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の定期健康診断結果報告のデータの分析4 - 地理的な位置関係との関連を分析

www.crosshyou.info

の続きです。前回は、2017年と2015年の所見率に違いがある、1事業所当たりの受診者数に違いがある、所見率の差と1事業所当たりの受診者数の差には関連はなさそう、ということがわかりました。

今回は、所見率の増減や、1事業所当たりの受診者数の増減が地理的な位置と関係があるのかどうかを調べてみたいと思います。

昔、何かの分析で上の図のような都道府県の県庁所在地の緯度、経度、緯度のランク、経度のランクのCSVファイルを作成しました。これを今回も使おうと思います。

まず、ファイルをRに読み込ませます。

このデータフレームを前回のデータフレーム、df_diffと統合します。

ido を縦軸、keido を横軸にして shokenritsu_diff を色にして散布図を描いてみます。

あんまりよくわからないですね。。

per_jushin_diff も同じようにグラフにしてみます。

なんとなくですが、本州の関東から近畿ぐらいまでは per_jushin_diff が減少しているような気がします。

shokenritsu_diff を ido, keido で回帰分析してみます。

summary() 関数の結果の一番下の行にある、p-value を見ると、0.1191 ですから、ido, keido は shokenritsu_diff とは関係なさそうですね。

per_jushin_diff も同じように回帰分析してみます。

p-value: 0.2399 とありますから、per_jushin_diff も ido, keido には関連ななさそうです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 緯度、経度のデータを読み込む
pref_map <- read_csv("pref_ido_keido.csv")
glimpse(pref_map)
#
# df_diffとpref_mapの統合
df_map <- df_diff |> 
  inner_join(pref_map, join_by(pref == 都道府県))
glimpse(df_map |> slice(1:3))
#
# shokenritsu_diffのグラフ
df_map |> 
  ggplot(aes(x = keido, y = ido, color = shokenritsu_diff)) +
  geom_point(size = 4) +
  geom_text(aes(label = pref), hjust = 1.2) +
  theme_minimal()
#
# per_jushin_diff のグラフ
df_map |> 
  ggplot(aes(x = keido, y = ido, color = per_jushin_diff)) +
  geom_point(size = 4) +
  geom_text(aes(label = pref), hjust = 1.2) +
  theme_minimal()
#
#
# shokenritsu_diff を回帰分析
lm_mod1 <- lm(shokenritsu_diff ~ ido + keido + I(ido^2) + I(keido^2) +
                ido:keido, data = df_map)
summary(lm_mod1)
#
# per_jushin_diff を回帰分析
lm_mod2 <- lm(per_jushin_diff ~ ido + keido + I(ido^2) + I(keido^2) +
                ido:keido, data = df_map)
summary(lm_mod2)
#

 

 

 

 

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは Long wide view of natural landscape, blue sky, green grass land, close up of purple morning glory flowers, photo です。)