Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のNHKのコロナ感染者データの分析2 - 大阪のコロナでの死亡、コロナ感染、コロナ致死率のリスク比を計算する。

f:id:cross_hyou:20220109074327j:plain

Photo by Francisco Moreno on Unsplash 

www.crosshyou.info

の続きです。

大阪の人口当たりのコロナ死亡者数はダントツに多いことがわかりました。

それでは、コロナ感染者数はどうでしょうか?

まずはグラフを描いてみます。

f:id:cross_hyou:20220109074847p:plain

f:id:cross_hyou:20220109074901p:plain

一番多いのは沖縄、2番目は東京で大阪は3番目です。

死亡者数と同じように、カイ二乗検定で大阪の人口当たりのコロナ感染者数は統計的に有意なのかどうかを確認します。まず、大阪の感染者数と大阪以外の感染者数を調べます。

f:id:cross_hyou:20220109080744p:plain

大阪の感染者数は205,545人、大阪以外の感染者数は1,537,891人です。

大阪の人口は8,809,000人、大阪以外の人口は117,358,000人です。

これらのデータからマトリックスを作成します。

f:id:cross_hyou:20220109081443p:plain

前回の死亡者数は人口から比べるとかなり小さかったので、人口をそのまま使いましたが、感染者数は人口と比較して少し多いので、人口から感染者数を引いて、非感染者数を使っています。

それでは、chisq.test()関数でみてみましょう。

f:id:cross_hyou:20220109081804p:plain

p値は2.2e-16よりも小さいので有意な違いがありますね。当然、大阪よりも人口当たりの感染者数の多い沖縄、東京も有意に感染者数が多い、ということです。

続きまして、感染者当りの死亡者の割合はどうでしょうか?

まずは、その割合を表す変数を作成します。

f:id:cross_hyou:20220109075605p:plain

パーセント表示にしていますので、一番ひくいところは0.27%で、一番高いところは2.39%です。

グラフにしてみます。

f:id:cross_hyou:20220109080047p:plain

f:id:cross_hyou:20220109080057p:plain

北海道が一番高く、2番目は徳島、3番目は福島でした。大阪は8番目でした。

死亡者/感染者もカイ二乗検定で大阪は有意に高いのかどうかを調べます。

すでに、大阪の死亡者数は3,064人、感染者数は205,545人、

大阪以外の死亡者数は15,328人、感染者数は1,537,891人とわかっていますので、これからカイ二乗のためのマトリックスを作成します。

f:id:cross_hyou:20220109083133p:plain

chisq.test()関数でカイ二乗検定をします。

f:id:cross_hyou:20220109083346p:plain

p値は2.2e-16よりも小さいですので、大阪の致死率は有意にその他の都道府県の致死率よりも高いことがわかります。当然、大阪よりも致死率の高い北海道、徳島、福島、兵庫、石川、山形、岩手、愛媛も致死率が有意に高いということです。

いままで3つのマトリックスを作成しました。

f:id:cross_hyou:20220109083943p:plain

せっかく作ったので、もう少しこれらのマトリックスで遊んでみます。

オッズ比を算出してみましょう。

f:id:cross_hyou:20220109090330p:plain

オッズ比が一番大きいのはdeath_matrixですね。

リスク比も計算してみます。

f:id:cross_hyou:20220109091350p:plain

つまり大阪は、その他の都道府県より、死亡するリスクは2.67倍、感染するリスクは1.78倍、感染したら死亡するリスクは1.36倍ということです。

今回は以上です。

次回は

 

www.crosshyou.info

 

始めから読むには、

 

www.crosshyou.info

です。