www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の乳用牛のデータ分析3 - R言語のhist関数、boxplot関数でデータを視覚化する。

 

www.crosshyou.info

 の続きです。

今回は、R言語のhist関数でヒストグラム、boxplot関数で箱ひげ図を描き、データを視覚化します。

hist関数

1飼養家当りの牛の数のヒストグラム

hist関数

搾乳牛と乾乳牛の比率のヒストグラム

hist関数

大人の牛と子どもの牛の比率のヒストグラム

ヒストグラムを見ると、Saku_Kanが一番ばらつきが小さいような気がします。

boxplot関数で箱ひげ図を描いてみます。

boxplot関数

1飼養家当りの牛の数の箱ひげ図

1飼養家当りの牛の数の箱ひげ図です。4つの外れ値があります。

boxplot関数

搾乳牛と乾乳牛の比率の箱ひげ図

搾乳牛と乾乳牛の比率には外れ値はありません。

boxplot関数

大人の牛と子どもの牛の比率の箱ひげ図

大人の牛と子どもの牛の比率には3つ外れ値があります。

ヒストグラム、箱ひげ図の形状を見ると、Saku_Kanが一番ばらつきが小さいようです。

変動係数(CV)を計算して数値的に確認しましょう。

変動比率は 標準偏差 / 平均値 で計算します。R言語ではsd関数で標準偏差を計算します。

sd関数 / mean関数 = 変動係数

変動係数はSaku_Kanが0.059と一番小さいです。つまりSaku_Kanが一番ばらつきが小さいということで、ヒストグラム、箱ひげ図を見た印象と一致しました。

今回は以上です。