Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の新型コロナ陽性者数のデータ分析4 - R言語のchisq.test関数で曜日と性別のクロス表分析をする。

 

www.crosshyou.infoの続きです。

今回は、曜日と性別でクロス表分析をします。

まずは普通にtable関数で集計します。

f:id:cross_hyou:20200606120942j:plain

調査中と不明は削除しましょう。

f:id:cross_hyou:20200606121031j:plain

集計用に作成した曜日と性別で集計します。

f:id:cross_hyou:20200606121141j:plain

prop.table関数で男女の比率を見てみます。

f:id:cross_hyou:20200606121241j:plain

prop.table関数でmargin = 1 とすると行ごとに比率を計算します。火曜日は女性の比率が他の曜日と比べて低く、日曜日は高いです。

barplot関数でグラフにしてみます。

f:id:cross_hyou:20200606121437j:plain

f:id:cross_hyou:20200606121447j:plain

それほど大きな違いとは見えないです。

chisq.test関数でカイ二乗検定をします。

f:id:cross_hyou:20200606121656j:plain

p-value =0.2172と0.05よりも大きいです。曜日によって性別に違いがあるとは言えないです。

今回は以上です。