Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の工場立地動向調査のデータの分析5 - 階層的クラスタリング

Bing Image Creator で生成: Flower garden, Autum season, Photo

www.crosshyou.info

の続きです。

今回は、Rで階層的クラスタリングをしてみます。

まず、データフレームからマトリックスを生成します。

次に、dist()関数で距離オブジェクトを生成します。

次に、hclust()関数でクラスタリングします。

plot()関数で樹形図を描きます。

工場の多い、茨城県や静岡県、愛知県などは左側のクラスターに分類されています。

rect.hclust()関数で3つのクラスターに分けてグラフにしてみます。

cutree()関数でクラスタリングの結果をデータフレームに追加します。

上の樹形図と見比べると、1は右側のクラスター、2は左側のクラスター、3は真ん中のクラスターですね。

クラスターで色分けした散布図を描いてみます。

3つの散布図を見ると、3のクラスターが小規模、2のクラスターが大規模、1のクラスターが中規模、という感じですね。

そこで、わかりやすく、1, 2, 3をmid, large, small に変更します。

今回は以上です。

次回は、

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

です。