Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の一般病院病床利用率のデータ分析4 - 各変数の分布を見てskewを計算する。

f:id:cross_hyou:20210822192143j:plain

Photo by Tim Mossholder on Unsplash  

www.crosshyou.info

 の続きです。

今回はriyou以外の各変数の分布をみてみます。

まずは、mitsudo: 可住地面積1平方キロメートル当たりの人数、つまり人口密度です。

f:id:cross_hyou:20210822192502p:plain

f:id:cross_hyou:20210822192521p:plain

右のほうに外れ値っぽい分布があるのがわかります。

対数変換してヒストグラムを描いてみます。

f:id:cross_hyou:20210822192719p:plain

f:id:cross_hyou:20210822192730p:plain

対数変換した値のほうが左右対称に近い分布になりますね。

データ分析するときは、左右対称の分布のほうが扱いやすいです。

skewという値を計算して分布の左右対称度合いを測ります。

まず、skewを計算する自作関数を作ります。

f:id:cross_hyou:20210822193130p:plain

この自作関数でmitsudoとlog(mitsudo)のskewを計算します。

f:id:cross_hyou:20210822193822p:plain

対数変換したmitsudoのほうが0に近いので左右対称に近いです。

対数変換したmitsudoをデータフレームに追加します。

f:id:cross_hyou:20210822194000p:plain

続いて、shotoku: 1人当たり県民所得(千円)のヒストグラムを描いてみます。

f:id:cross_hyou:20210822194110p:plain

f:id:cross_hyou:20210822194123p:plain

これも右のほうに外れ値のようなものがありますね。

対数変換したshotokuのヒストグラムを描いてみます。

f:id:cross_hyou:20210822194231p:plain

f:id:cross_hyou:20210822194240p:plain

少しはましになったかな?

skewを計算してみます。

f:id:cross_hyou:20210822194440p:plain

対数変換したshotokuのほうが0に近いので、より左右対称に近いということです。

対数変換したshotokuをデータフレームに追加します。

f:id:cross_hyou:20210822194605p:plain

iryou: 1人当たり医療費(千円)のヒストグラムを描いてみます。

f:id:cross_hyou:20210822194709p:plain

f:id:cross_hyou:20210822194721p:plain

これは前の2つと比べると左右対称に近いですね。

対数変換したiryouのヒストグラムを描いてみます。

f:id:cross_hyou:20210822194836p:plain

f:id:cross_hyou:20210822194846p:plain

これも左右対称に近いですね。

見た目ではそのままのiryouと対数変換したiryouのどちらが左右対称に近いか判断できないです。skewを計算してみます。

f:id:cross_hyou:20210822195117p:plain

対数変換したiryouのほうが0に近いです。

対数変換したiryouをデータフレームに追加します。

f:id:cross_hyou:20210822195218p:plain

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには

 

www.crosshyou.info

 です。