Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の新型コロナ陽性者数のデータ分析2 - R言語のtable関数を使い各変数で集計する。

 

www.crosshyou.infoの続きです。

今回はR言語のtable関数を使って集計をしてみます。

まずは公表_日付で集計しました。

f:id:cross_hyou:20200531105752j:plain

 数が多いですから、plot関数でグラフにします。

f:id:cross_hyou:20200531110003j:plain

f:id:cross_hyou:20200531110017j:plain

テレビでよく見るようなグラフになりました。

 

曜日で集計してみます。

f:id:cross_hyou:20200531110122j:plain

曜日の順番がバラバラですね。なおします。

f:id:cross_hyou:20200531110224j:plain

再び集計します。

f:id:cross_hyou:20200531110444j:plain

barplot関数でグラフにしてみます。

f:id:cross_hyou:20200531110603j:plain

f:id:cross_hyou:20200531110611j:plain

月曜日が一番少なく、金曜日が一番多いです。

 

居住地で集計してみます。

f:id:cross_hyou:20200531110734j:plain

居住地はほとんどが都内ですね。23区、市までわかったらよかったですが。。

 

年代別で集計します。

f:id:cross_hyou:20200531110919j:plain

100歳以上を90代の次にくるようにして - の1人と不明の7人を合わせます。

f:id:cross_hyou:20200531111030j:plain

再び集計します。

f:id:cross_hyou:20200531111112j:plain

barplot関数でグラフにします。

f:id:cross_hyou:20200531111230j:plain

f:id:cross_hyou:20200531111245j:plain

20代、30代が一番多いです。

 

性別で集計します。

f:id:cross_hyou:20200531111349j:plain

男性のほうが女性より多いです。

 

退院済フラグで集計します。

f:id:cross_hyou:20200531111456j:plain

あれ、1しかないですね、summary関数でみてみます。

f:id:cross_hyou:20200531111544j:plain

NAが617ありました。これを0にしましょう。

f:id:cross_hyou:20200531111629j:plain

再び集計します。

f:id:cross_hyou:20200531111714j:plain

退院済みの人が4600人ということですね。

今回は以上です。