Photo by Thijs Boom on Unsplash
この記事は上の記事の続きです。
今回は、R言語に読み込んだデータをグラフにしてみます。tidyverseパッケージを使わずに、通常のグラフィック関数でやってみます。
まずは、それぞれの変数の分布状況をヒストグラムにしてみます。
num: 検査実施事業場数 のヒストグラムをみてみます。hist()関数を使います。
左にかたよった分布状況ですね。対数値に変換したヒストグラムを作りましょう。
log()関数で自然対数に変換します。対数変換した値のほうが左右対称に近いですね。
あとで分析するときに、左右対称に分布しているデータのほうが分析しやすいので、対数変換した num: 検査実施事業場数 の変数を作っておきましょう。
次は、two: 2回以上検査実施した事業場数 のヒストグラムを見てみます。
breaks = 15 というオプションを加えて、ヒストグラムの棒の本数を15本にしてみました。これも対数変換したほうが左右対称になりそうです。
two: 2回以上検査実施した事業場数 の対数変換した変数も作っておきましょう。
2回以上検査を実施した事業場の割合の変数を作成して、そのヒストグラムも見てみます。
breaks = c(~~~~) でヒストグラムの区分を指定することもできます。0.2から0.6の範囲に収まっていますね。
次は、jushin: 受診者数 です。
これも対数変換した変数を作ったほうがよさそうです。
freq = FALSE というオプションを加えて、縦軸を頻度から割合に変更しています。12ぐらいの値が全体の半数以上を占めていることがわかります。
次は、shoken: 所見のあった人数です。
これも対数変換したほうがいいでしょう。
border = のオプションでヒストグラムの棒の境界線の色を指定できます。
最後の変数は ritsu: 所見のあった人数の割合です
これは、対数変換しなくてもいいですね。パーセントで表示しているようなので、これをtworatioと合わせたて小数点表示にしておきます。
今回は以上です。
今回使った関数は、
hist()関数 --- ヒストグラムを作成
log()関数 --- 対数変換
でした。
次回は、
です。
初めから読むには、
です。