www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

県民経済計算の分析1 - 基本統計量

今回は、都道府県別の県内総生産などのデータ分析をしてみたいと思います。

データは、「日本の統計」のウェブサイト、

www.stat.go.jpここから取得しました。

f:id:cross_hyou:20181016115804j:plain

この3-15 県民経済計算 というファイルです。

実際のファイルがこれです。

f:id:cross_hyou:20181016115911j:plain

これをR言語に読込ませやすいようにCSVファイルに加工しました。

f:id:cross_hyou:20181016120922j:plain

これをread.csv関数でR言語に読込ませます。summary関数で最小値、第1分位値、中央値、平均値、第3分位値、最大値が表示されます。

f:id:cross_hyou:20181016122250j:plain

都道府県のデータ項目はカテゴリカル変数で、その他は数値データですね。県民所得は1000円単位、対前年度増加率はパーセント、その他は10億円単位です。

県内総生産の平均は10兆9420億円、一人当たり県民所得の平均値は282万1000円ということです。

summary関数では標準偏差が算出されないので、sd関数とapply関数で算出します。

f:id:cross_hyou:20181016122722j:plain

標準偏差をみても、どのデータ項目が一番バラツキがあるか簡単にはわからないので、標準偏差を平均値で割った、変動係数を算出しましょう。

f:id:cross_hyou:20181016123014j:plain

一人当たり県民所得が一番バラツキが小さく、対前年度増加率が一番バラツキが多いことがわかります。