www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の新型コロナ陽性者数のデータ分析5 - R言語のchisq.test関数で曜日と退院済フラグのクロス表分析をする。

 

www.crosshyou.infoの続きです。

今回は曜日 x 退院済フラグでクロス表を作ります。

 

f:id:cross_hyou:20200606194906j:plain

これは、不要なデータを削除する必要はないですね。

prop.table関数で比率を見ましょう。

f:id:cross_hyou:20200606195141j:plain

金曜日が退院済フラグが0、退院していない人が多いです。

barplot関数でグラフにします。

f:id:cross_hyou:20200606195448j:plain

f:id:cross_hyou:20200606195459j:plain

prop.table(曜日退x院済フラグ, margin = 2)[ , 1]と[ , 1]を付けて1列目だけをグラフにしています。金曜日が高いのがよくわかります。

chisq.test関数でこの金曜日の比率の高さは偶然の範囲なのかどうか検定します。

f:id:cross_hyou:20200606195815j:plain

p-value = 0.0005599と0.05よりも小さいです。金曜日の比率の高さは偶然とは言えないです。

$stdresで調整済み残差を見ます。

f:id:cross_hyou:20200606200033j:plain

月曜日と金曜日が有意に0が多く、土曜日は有意に0が少ないです。

今回は以上です。