crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のNHKのコロナ感染者データの分析3 - 全都道府県のコロナでの死亡、コロナ感染、致死率のオッズ比とリスク比を算出する。

f:id:cross_hyou:20220110074902j:plain

Photo by Andre Benz on Unsplash 

www.crosshyou.info

の続きです。前回は大阪のコロナでの死亡やコロナ感染、コロナの致死率などのオッズ比、リスク比を算出しました。

今回は全都道府県のオッズ比、リスク比を算出しましょう。

まず、計算に必要なデータを用意してデータフレームを作ります。

f:id:cross_hyou:20220110075601p:plain

caseがコロナ感染者数、deathがコロナ死亡者数、popが人口です。

この3つの全都道府県の合計値を追加します。

f:id:cross_hyou:20220110080111p:plain

こうして計算した全都道府県の合計値からそれぞれのcase, death, popの値を引けば、それぞれの都道府県のその他都道府県の合計値になります。

f:id:cross_hyou:20220110081128p:plain

さらに、人口 - コロナ死亡者、人口 - コロナ感染者、コロナ感染者 - コロナ死亡者を追加します。

f:id:cross_hyou:20220110083013p:plain

これで計算に必要なデータは揃いました。

まずは、コロナ死亡者のカイ二乗検定のp値を計算します。

基になるクロス表は、

f:id:cross_hyou:20220110083400p:plain

です。for () ループを使って計算します。

f:id:cross_hyou:20220110084606p:plain

これで、pvaluesというオブジェクトに各都道府県のコロナ死亡者のカイ二乗検定のp値が格納されました。df_statsに追加します。

f:id:cross_hyou:20220110085155p:plain

埼玉、神奈川、愛知以外はp値は0.05以下ということです。

コロナでの死亡のオッズ比を算出しましょう。

計算式は、

(death*pop_death_others)/(death_others*pop_death)

です。

f:id:cross_hyou:20220110090725p:plain

f:id:cross_hyou:20220110090736p:plain

オッズ比を/1e6をしないで計算しようとしたら、整数の桁あふれになってしましましたので、/1e6で処理して計算しています。愛知、埼玉、神奈川はp値は0.05以上でしたが、オッズ比はほぼ1です。大阪がとびぬけていることが確認できます。

リスク比も算出します。

リスク比は

(death/pop)/(death_others/pop_others)です。

f:id:cross_hyou:20220110091632p:plain

f:id:cross_hyou:20220110091643p:plain

続いて、コロナ感染者のカイ二乗検定のp値を調べましょう。

基になるクロス表の構造は、

f:id:cross_hyou:20220110092151p:plain

さきほどと同じようにfor loopでp値を計算します。

f:id:cross_hyou:20220110092837p:plain

p値が0.05よりも大きい都道府県は無いようです。

コロナ感染者のオッズ比を算出します。

計算式は

(case/case_pop)/(case_others/pop_case_others)

です。

f:id:cross_hyou:20220110093537p:plain

f:id:cross_hyou:20220110093546p:plain

感染者のオッズ比は沖縄が一番高く、秋田が一番低いです。

リスク比を算出します。

算式は

(case/pop)/(case_others/pop_others)

です。

f:id:cross_hyou:20220110094139p:plain

f:id:cross_hyou:20220110094149p:plain

沖縄が一番高く、秋田が一番低いです。

今度は致死率のカイ二乗検定のp値を算出しましょう。

基になるクロス表の構造は、

f:id:cross_hyou:20220110094650p:plain

for loopでp値を計算します。

f:id:cross_hyou:20220110095713p:plain

致死率のp値は0.05より大きい都道府県がたくさんありますね。コロナ感染率、コロナ死亡率と比較して致死率は都道府県でそれほど差は無いのかもしれません。

オッズ比を算出します。

算式は、

(death/case_death)/(death_others/case_death_others)

です。

f:id:cross_hyou:20220110101114p:plain

f:id:cross_hyou:20220110101124p:plain

青枠で囲った都道府県はp値が0.05よりも大きなところです。

致死率のリスク比を算出します。

算式は

(death/case)/(death_others/case_others)

です。

f:id:cross_hyou:20220110101703p:plain

f:id:cross_hyou:20220110101714p:plain

北海道が一番リスク比が高く、島根が一番低いです。

今回は以上です。

初めから読むには、

 

www.crosshyou.info