今回は、都道府県別の県内総生産などのデータ分析をしてみたいと思います。
データは、「日本の統計」のウェブサイト、
www.stat.go.jpここから取得しました。
この3-15 県民経済計算 というファイルです。
実際のファイルがこれです。
これをR言語に読込ませやすいようにCSVファイルに加工しました。
これをread.csv関数でR言語に読込ませます。summary関数で最小値、第1分位値、中央値、平均値、第3分位値、最大値が表示されます。
都道府県のデータ項目はカテゴリカル変数で、その他は数値データですね。県民所得は1000円単位、対前年度増加率はパーセント、その他は10億円単位です。
県内総生産の平均は10兆9420億円、一人当たり県民所得の平均値は282万1000円ということです。
summary関数では標準偏差が算出されないので、sd関数とapply関数で算出します。
標準偏差をみても、どのデータ項目が一番バラツキがあるか簡単にはわからないので、標準偏差を平均値で割った、変動係数を算出しましょう。
一人当たり県民所得が一番バラツキが小さく、対前年度増加率が一番バラツキが多いことがわかります。