Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の定期健康診断結果報告のデータ分析2 - R言語でヒストグラムを描く

Photo by Thijs Boom on Unsplash 

www.crosshyou.info

この記事は上の記事の続きです。

今回は、R言語に読み込んだデータをグラフにしてみます。tidyverseパッケージを使わずに、通常のグラフィック関数でやってみます。

まずは、それぞれの変数の分布状況をヒストグラムにしてみます。

num: 検査実施事業場数 のヒストグラムをみてみます。hist()関数を使います。

左にかたよった分布状況ですね。対数値に変換したヒストグラムを作りましょう。

log()関数で自然対数に変換します。対数変換した値のほうが左右対称に近いですね。

あとで分析するときに、左右対称に分布しているデータのほうが分析しやすいので、対数変換した num: 検査実施事業場数 の変数を作っておきましょう。

次は、two: 2回以上検査実施した事業場数 のヒストグラムを見てみます。

breaks = 15 というオプションを加えて、ヒストグラムの棒の本数を15本にしてみました。これも対数変換したほうが左右対称になりそうです。

two: 2回以上検査実施した事業場数 の対数変換した変数も作っておきましょう。

2回以上検査を実施した事業場の割合の変数を作成して、そのヒストグラムも見てみます。

breaks = c(~~~~) でヒストグラムの区分を指定することもできます。0.2から0.6の範囲に収まっていますね。

次は、jushin: 受診者数 です。

これも対数変換した変数を作ったほうがよさそうです。

freq = FALSE というオプションを加えて、縦軸を頻度から割合に変更しています。12ぐらいの値が全体の半数以上を占めていることがわかります。

次は、shoken: 所見のあった人数です。

これも対数変換したほうがいいでしょう。

border = のオプションでヒストグラムの棒の境界線の色を指定できます。

 

最後の変数は ritsu: 所見のあった人数の割合です

これは、対数変換しなくてもいいですね。パーセントで表示しているようなので、これをtworatioと合わせたて小数点表示にしておきます。

今回は以上です。

今回使った関数は、

hist()関数 --- ヒストグラムを作成

log()関数 --- 対数変換

でした。

次回は、

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

です。