Photo by Andre Benz on Unsplash
の続きです。前回は大阪のコロナでの死亡やコロナ感染、コロナの致死率などのオッズ比、リスク比を算出しました。
今回は全都道府県のオッズ比、リスク比を算出しましょう。
まず、計算に必要なデータを用意してデータフレームを作ります。
caseがコロナ感染者数、deathがコロナ死亡者数、popが人口です。
この3つの全都道府県の合計値を追加します。
こうして計算した全都道府県の合計値からそれぞれのcase, death, popの値を引けば、それぞれの都道府県のその他都道府県の合計値になります。
さらに、人口 - コロナ死亡者、人口 - コロナ感染者、コロナ感染者 - コロナ死亡者を追加します。
これで計算に必要なデータは揃いました。
まずは、コロナ死亡者のカイ二乗検定のp値を計算します。
基になるクロス表は、
です。for () ループを使って計算します。
これで、pvaluesというオブジェクトに各都道府県のコロナ死亡者のカイ二乗検定のp値が格納されました。df_statsに追加します。
埼玉、神奈川、愛知以外はp値は0.05以下ということです。
コロナでの死亡のオッズ比を算出しましょう。
計算式は、
(death*pop_death_others)/(death_others*pop_death)
です。
オッズ比を/1e6をしないで計算しようとしたら、整数の桁あふれになってしましましたので、/1e6で処理して計算しています。愛知、埼玉、神奈川はp値は0.05以上でしたが、オッズ比はほぼ1です。大阪がとびぬけていることが確認できます。
リスク比も算出します。
リスク比は
(death/pop)/(death_others/pop_others)です。
続いて、コロナ感染者のカイ二乗検定のp値を調べましょう。
基になるクロス表の構造は、
さきほどと同じようにfor loopでp値を計算します。
p値が0.05よりも大きい都道府県は無いようです。
コロナ感染者のオッズ比を算出します。
計算式は
(case/case_pop)/(case_others/pop_case_others)
です。
感染者のオッズ比は沖縄が一番高く、秋田が一番低いです。
リスク比を算出します。
算式は
(case/pop)/(case_others/pop_others)
です。
沖縄が一番高く、秋田が一番低いです。
今度は致死率のカイ二乗検定のp値を算出しましょう。
基になるクロス表の構造は、
for loopでp値を計算します。
致死率のp値は0.05より大きい都道府県がたくさんありますね。コロナ感染率、コロナ死亡率と比較して致死率は都道府県でそれほど差は無いのかもしれません。
オッズ比を算出します。
算式は、
(death/case_death)/(death_others/case_death_others)
です。
青枠で囲った都道府県はp値が0.05よりも大きなところです。
致死率のリスク比を算出します。
算式は
(death/case)/(death_others/case_others)
です。
北海道が一番リスク比が高く、島根が一番低いです。
今回は以上です。
初めから読むには、