今回は都道府県別の一般事業投資額のデータを分析したいと思います。
データは政府統計の総合窓口、e-Statから取得しました。
www.e-stat.go.jpここからCSVファイルをダウンロードしました。
各変数名は、
Nen: 調査年
Chi: 地域
Jin: 総人口(人)
Non: 従業も通学もしていない人口(人)
Sho: 1人当り県民所得(千円)
Sala: 賃金・俸給(百万円)
Zai: 財産所得(百万円)
Tou: 一般事業投資額
になります。
R言語のread.csv関数で読み込みます。
read.csv関数で読み込んだあとに、na.omit関数でNAのある行を削除しました。そして、str関数でdfのデータ構造を確認しています。データフレームで、94の観測と8の変数を持つデータです。
従業も通学もしていない人口を実数でなく、総人口に対する割合(%)にしましょう。
round関数で小数点以下2桁にしました。summary関数で最小値などを計算しました。最小値は、28.33%、最大値は、40.36%、平均値は36.39%、中央値は36.37%です。
1人当りの賃金・俸給(百万円)を求めます。
最小値は、115万4千円、最大値は222万8千円、平均値は157万1千円、中央値は157万0千円です。
1人当りの財産所得(百万円)を求めます。
最小値は、7万5千円、最大値は62万2千円、平均値は15万05百円、中央値は13万6千円です。
一人当たりの一般事業総投資額を求めます。
最小値は7万1910円、最大値は、58万9400円、中央値は18万1250円、平均値は18万8570円です。
1人当りの県民所得の平均値なども求めましょう。
最小値は198万1千円、最大値は537万8千円、平均値は276万1千円、中央値は272万0千円でした。
ここで分析で使う変数を整理しましょう。
Nen, Chi, Sho, Non2, Sala2, Zai2, Tou2ですね。
Nen(調査年)はファクタですが、要素が0の水準も残っていますから、整理します。
調査年は、2010年度と2015年度の2つだけですね。
今回は以上です。